データアーキテクチャーとは ビッグデータをどのようにビジネスに活かすか
ビッグデータは重要な課題です。ほぼすべての業界で、収益拡大のためにデータによる裏付けを活用する競争が始まっています。 多くのビジネスリーダーが、ビッグデータのプールに溺れることなく飛び込む方法について考えています。
ビッグデータを最大限に活用するためには、一旦立ち止まって、最先端のデータアーキテクチャーの主な特徴と、そのアーキテクチャーが生データを信頼できる実用的なインサイトに変換する方法を理解することが有用です。 また、データアーキテクトがどのような存在で、データを有用なものにするためにどういった活動をしているのかについても知っておくと良いでしょう。
データアーキテクチャーとは
データアーキテクチャーとは、企業によるデータの収集、保存、変換、配信、そして利用の方法を標準化するプロセスです。 その目標は、データを必要とするユーザーに必要なタイミングで適切なデータを提供し、ユーザーがデータを理解できるよう支援することです。
数十年にわたり、データが必要となった事業戦略家はIT部門に要求し、IT部門がデータを提供するシステムを構築していました。 こうした冗長で時間のかかるプロセスではしばしば、事業戦略家が期待する、あるいは必要とするデータ以外のものが生み出されていました。 このような環境では、適切なデータを適切なタイミングで利用することは困難であり、ビジネス戦略を制限する要因となっていました。
社内外のソースからのリアルタイムデータが利用可能になり、その範囲が拡大したことによって、事業戦略家はデータからより速く、より多くの知見を得たいと考えるようになりました。
最先端のデータアーキテクチャーデザインでは、適切に設計されたプロセスによって事業戦略家と技術者の専門知識が同じテーブルに載ることが約束されます。 両者が連携して、ビジネスの推進に必要となるデータとその入手方法、そして意思決定者に実用的な情報をもたらすためのデータの配信方法を決定できます。
現実世界へのビッグデータの進出を後押ししたのは、クラウドの影響力の増大です。その結果、最先端のデータアーキテクチャーに必要となる、迅速かつ簡単で低コストのスケーラビリティが実現しました。 またクラウドにより、企業は自社データの大部分、あるいはすべてを1か所に集約できるようになりました。そこでは理論上、誰もが必要に応じて、唯一のマスターバージョンのデータを利用できます。
ビッグデータを活かすためのデータアーキテクチャー
ビッグデータは重要な課題です。ほぼすべての業界で、収益拡大のためにデータによる裏付けを活用する競争が始まっています。 多くのビジネスリーダーが、ビッグデータのプールに溺れることなく飛び込む方法について考えています。
ビッグデータを最大限に活用するためには、データアーキテクチャーが役立ちます。一旦立ち止まって、最先端のデータアーキテクチャーの主な特徴と、そのアーキテクチャーが生データを信頼できる実用的なインサイトに変換する方法を理解することが有用です。 また、データアーキテクトがどのような存在で、データを有用なものにするためにどういった活動をしているのかについても知っておくと良いでしょう。
データアーキテクトとは何か?
データアーキテクトとは、データアーキテクチャーの主導者であり、さまざまな事業部門からやって来るビジネスのニーズを、データとシステムの要件に変換します。 データアーキテクトは、ビジネスのニーズと目標から出発して、目標を達成するための技術ロードマップを策定します。 また、複数のソースからのデータを保存し、必要とする人に配信するためのデータフローとプロセスに関する構想を作成します。
データアーキテクトは、コラボレーションを率いる代表者であり、社内の複数の部門にまたがる関係者やビジネスパートナー、外部のベンダーを組織の目標に向かって連携させることで、データ戦略を規定します。 次を行うことでそれを可能にします。
- データビジョンの定義:ビジネスの要件を技術の要件に変換することでデータビジョンを定義します。これは社内のデータに関する基準およびポリシーの基盤となります。
- データアーキテクチャーの定義:データモデル、 メタデータ、セキュリティ、製品カタログなどの参照データ、そして在庫やサプライヤーなどのマスターデータの基準を含むデータアーキテクチャーを定義します。
- 構造の定義:意思決定者がデータシステムの構築と改良に利用できる構造を定義します。
- データフローの定義:自社のどの部門がデータを生成し、データを利用するのか、そしてデータフローの管理方法をコントロールするデータフローを定義します。
効果的なデータアーキテクチャーの特徴
次に示す特徴に基づいて構築されているデータアーキテクチャーは「最先端」であるといえます。
- ユーザー主導:かつて、データは静的なものであり、アクセスは制限されていました。 意思決定者は必ずしも欲しいデータや必要なデータを得られるとは限らず、入手できたデータで満足する必要がありました。 最先端のデータアーキテクチャーでは、データアーキテクトがデータをプールして、ビジネス目標を満足するような方法でデータにアクセスするソリューションを構築できるため、ビジネスユーザーは自信をもって要件を定義できます。
- 共有データに基づく構成:効果的なデータアーキテクチャーは、コラボレーションを促進するデータ構造を土台として構成されています。 優れたデータアーキテクチャーは、自社のあらゆる部門や、必要に応じて外部ソースからのデータを1か所に集約することでデータサイロを解消し、同じデータにおけるバージョンの競合をなくします。 この環境では、データは事業部門間で交換されたり、ひそかに貯蔵されたりするのではなく、企業全体の共有資産であると見なされます。
- 自動化:自動化によって、長く面倒な作業であった従来のデータシステムの構成が円滑になります。 数か月を要していたビルドプロセスは、クラウドベースのツールを使用することで数時間から数日で完了できるようになりました。 ユーザーが別のデータにアクセスしたい場合でも、アーキテクトは自動化によって素早くパイプラインを設計し、データを提供できます。 新しいデータが供給されたら、データアーキテクトはそのデータを素早くアーキテクチャーに統合できます。
- AI駆動型:スマートなデータアーキテクチャーは、機械学習(ML)と人工知能(AI)を使用してソリューションを新しい状況に適応させ、通知して推奨することにより、自動化を次の段階へと引き上げます。 MLとAIによって、データの種類を特定したり、データクオリティの異常を見つけて修正したり、受信データのための構造を作成したり、関係を明らかにして新しい知見を獲得したり、関連するデータセットや分析を推奨したりといったことが可能になります。
- 弾力性に富む:弾力性により、企業は必要に応じたスケールアップやスケールダウンが可能になります。 ここでは、需要に応じたスケーラビリティを迅速かつ手頃な価格で提供できる、クラウドが一番の味方です。 弾力性があれば、管理者はキャパシティの調整に労力を費やしたり、需要に追従するためにハードウェアに過剰投資したりせずに、トラブルシューティングと問題解決に集中できるようになります。
- シンプルである:効率的なデータアーキテクチャーという点では、シンプルさは複雑さに勝ります。 ショーに出る犬と、実際に働いてくれる馬のどちらが欲しいですか? データの移動やデータプラットフォーム、データアセンブリのフレームワーク、そして分析プラットフォームをシンプルにするよう努めましょう。
- 安全である:最先端のデータアーキテクチャーにはセキュリティが組み込まれており、企業の規定に従って必要な人だけがデータを利用できるようになっています。 また、優れたデータアーキテクチャーはデータセキュリティに対する既存の脅威や新たな脅威を識別して、HIPAAやGDPRのような法規制を確実に遵守できるようにします。
データアーキテクチャーとクラウド
ビッグデータと種々のワークロードにより、企業は新たな要件にオンデマンドで適応できる、スケーラブルで弾力性に富んだデータアーキテクチャーを必要とするようになりました。 幸いなことに、クラウドを活用することでこうしたスケーラビリティを手頃な価格で利用できます。 管理者の効率的なスケールアップやスケールダウンを可能にするというクラウドの能力によって、オンデマンドの開発環境やテスト環境、プロトタイプ作成や分析のための領域のような、新たなアプリケーションやユースケースへの道が開かれました。
クラウドが持つもう1つの利点は、回復力のあるシステムを手頃な価格で利用できることです。 最先端のデータアーキテクチャーの多くは、クラウドの大規模なサーバーファームで動作しており、現代のクラウドプロバイダーは冗長性やフェイルオーバー、高水準のサービスレベル合意を提供しています。 またクラウドを利用する管理者は、地理的に異なる場所にミラーイメージをセットアップできるため、ディザスタリカバリを低コストで実現できます。
データアーキテクチャーと情報アーキテクチャーの比較
データアーキテクチャーとは一言でいえば、生データを取得して操作し、共有可能な形式に変えることであるのに対して、情報アーキテクチャーとはデータをビジネスインテリジェンスに変換するプロセスのことです。情報アーキテクチャーは、データが結合され、関連付けられて分析される時だけ光を放ちます。 データアーキテクチャーが発電所なら、情報アーキテクチャーは照明装置です。
前日の売上高は、それ単体ではあまり意味を持ちませんが、過去の推移の情報を追加し、さらにコストや顧客定着率のデータとも比較することで、売上のデータが時間とともにどう変化しているのかだけでなく、なぜ変化しているのかを理解することができます。
たとえば、マーケティング担当役員であるあなたは、最近の売上増が宣伝の効果によるものなのか、それとも単に偶然なのかを知りたいとしましょう。 全く関係のない需要の急騰だったのでしょうか。 それとも、心配性のセールスチームが熱心にノルマに取り組んだのでしょうか。 宣伝活動が本当にうまくいったのでしょうか。 情報アーキテクチャーによって、マネージャーや役員は次の方針、たとえば何か新しいアクションを起こすのか、それとも現在の計画のまま続行するのかを自信をもって決定するために必要となる、深い知見を得ることができます。
データアーキテクチャーを始めるための3つのベストプラクティス
データアーキテクチャー戦略を策定する際、ビジネスリーダーは次の考慮事項を念頭に置く必要があります。
- コラボレーションがプロセスを推進します。 優れたデータアーキテクチャーは、企業のビジネス部門とIT部門が共通の目標と成果に向かってコラボレーションすることを可能にします。 ビジネスに最大の影響を与えるデータを意思決定者が定め、データアーキテクトがそのデータを入手してアクセス可能にするまでの道筋をつけます。
- データガバナンスを優先します。 データは高品質で、ビジネスとの関連性が高く、特定のビジネスニーズに的を絞ったものでなくてはなりません。 社内のエキスパートをデータスチュワードに任命し、自社のデータの検証とクリーニングを依頼しましょう。 あらゆる人々のデータクオリティを向上させることができるスチュワードのコミュニティを立ち上げます。
- 適応力の高さが俊敏性を高めます。 特定の技術やソリューションに縛られないに越したことはありません。 市場に新しい技術が登場したら、アーキテクチャーはそれを吸収して適応可能であるべきです。 データの種類が変更されるかもしれませんし、ツールやプラットフォームも変化する可能性があります。 したがって、優れたデータアーキテクチャーは、このような不可避の変化に対応できなくてはなりません。
データアーキテクチャーと自社の関係
ビッグデータの利用はこの10年間で爆発的に拡大し、新しいデータの量と割合は増加の一途をたどっています。 データを取得、保存、配信、そして利用する従来の手法は、最新のビジネス上の要求や顧客の要求を満足させるには煩雑で時間がかかりすぎることから、時代遅れとなりました。 しかし、ツールや技術が進化した結果、企業は自社のニーズに関連するデータを収集して利用するデータアーキテクチャーという強みを獲得しました。
データアーキテクチャーは、データの収集と利用を企業全体で標準化するためのデザインプラットフォームであり、すべてのデータユーザーが高品質で適切なデータに、迅速かつ比較的安価にアクセスできるようにします。 データアーキテクチャーは、ビジネスリーダーとIT部門の間に従来から存在するギャップを埋めて、テクノロジーとビジネス戦略を連携させてビジネスを加速するためのプラットフォームとなります。
Talendはデータ駆動型の企業を支援して、膨大な量のデータをクラウドスケールで信頼できる知見へと簡単に変換できるようにします。 当社のツールによって、クラウドにあるすべてのデータを素早くロードし、変換してクレンジングすることが可能となり、関係者に正確な知見を素早く提供できます。 Talendにより、クラウドが持つ弾力性とコスト上のメリットが最大限に活用できるようになり、IT部門はクラウドデータウェアハウスの費用を適切に管理しながら、生産性と俊敏性を向上させることができます。
始める準備ができたら、業界をリードする最先端のデータ管理プラットフォームであるTalend Data Fabricをダウンロードしてください。