データセットの概要
Adobe Experience Platform に正常に取り込まれたすべてのデータは、Data Lake 内にデータセットとして保持されます。データセットは、通常、スキーマ(列)とフィールド(行)を含むテーブルであるデータコレクションのストレージと管理をおこなう構成体です。データセットには、保存するデータの様々な側面を記述したメタデータも含まれます。
このドキュメントでは、Experience Platform のデータセットのおおまかな概要を説明します。
データセットの作成とメタデータの追跡
Catalog Service は、Experience Platform 内のデータの場所と系列のレコードシステムであり、データセットの作成と管理に使用されます。Catalog は各データセットのメタデータを追跡します。このメタデータには、データセットが準拠する Experience Data Model(XDM)スキーマへの参照(次の節で説明)と、そのデータセットに取り込まれるレコード数が含まれます。
詳しくは、「カタログサービスの概要」を参照してください。
データセットデータに対する制限の適用
Experience Data Model(XDM)は、Platform が顧客体験データを整理する際に使用する標準化されたフレームワークです。Platform に取り込まれるすべてのデータは、Data Lake にデータセットとして保持する前に、事前定義済みの XDM スキーマに準拠している必要があります。
すべてのデータセットには、保存できるデータの形式と構造を制限する XDM スキーマへの参照が含まれています。データセットの XDM スキーマに準拠していないデータセットにデータをアップロードしようとすると、データの取得に失敗します。
XDM について詳しくは、「XDM システムの概要」を参照してください。
データセットへのデータの取り込み
Adobe Experience Platform のデータ取得は、Platform が様々なソースからデータを取り込む複数の方法を表します。取得方法に関係なく、正常に取り込まれたデータはすべてバッチファイルに変換されます。バッチとは、1 つの単位として取り込まれる 1 つ以上のファイルで構成されるデータの単位です。その後、これらのバッチファイルは、専用のデータセットに追加され、Data Lake 内で保持されます。
詳しくは、「データ取得の概要」を参照してください。
スキーマのデータセットに適用されるラベル
Adobe Experience Platform データガバナンスを使用すると、データの使用に適した規制、制限、ポリシーへのコンプライアンスを確保するために、顧客データを管理できます。データガバナンスフレームワークを使用すると、使用ラベルを適用し、そのデータに適用される使用ポリシーに従ってデータを分類できます。 ラベルは、個々のスキーマ、それらのスキーマ内のフィールド、個々のデータセット全体に適用できます。 ラベルがスキーマに直接適用されると、これらのラベルは、そのスキーマに基づくすべての既存のデータセットと今後のデータセットに伝播されます。
このサービスについて詳しくは、「データガバナンスの概要」を参照してください。Platform で使用状況ラベルを使用する手順については、次のガイドを参照してください。
ダウンストリーム Platform サービスのデータセット
データセットを使用して、取り込んだデータを保存すると、ダウンストリーム Platform サービスでこれらのデータセットが使用され、顧客プロファイルの更新や機械学習を通じたインサイトの取得などが行われます。
様々な操作にデータセットを使用するダウンストリームサービスのリストを次に示します。詳しくは、各サービスのドキュメントを参照してください。
- Data Access API:データセット内に保存されたファイルの内容にアクセスしてダウンロードできます。
- Adobe Experience Platform ID サービス:デバイスやシステム間で ID をブリッジし、準拠する XDM スキーマで定義された ID フィールドに基づいてデータセットをリンクします。
- Real-Time Customer Profile:Identity Service を使用して、データセットから詳細な顧客プロファイルをリアルタイムで作成できます。Real-Time Customer Profile は Data Lake からデータを取り込み、顧客プロファイルを独立したデータストアに保持します。
- Adobe Experience Platform セグメント化サービス:Real-Time Customer Profile データからセグメントを作成し、オーディエンスを生成できるようにします。これらのオーディエンスは、Data Lake 内の独自のデータセットに書き出すことができます。
- Adobe Experience Platform Data Science Workspace:機械学習と人工知能を使用して、大規模なデータセットからインサイトを引き出します。
- Adobe Experience Platform クエリサービス:Experience Platform で標準の SQL を使用してデータをクエリし、Data Lake 内のデータセットと結合したり、Data Science Workspace、または Real-Time Customer Profile で使用する新しいデータセットとしてクエリ結果を取得したりできます。
- Adobe Experience Platform Destinations Service:レポーティングやデータサイエンスアクティビティ用に、データセットを希望のクラウドストレージやメールマーケティング宛先に書き出すことができます。
次の手順
このドキュメントでは、Experience Platform でデータセットを使用する主要な方法と、データセットを活用した様々な Platform サービスについて説明しました。Platform でデータセットを使用する様々な方法について詳しくは、この概要でリンクされているサービスドキュメントを参照してください。
Experience Platform UI でデータセットを操作する手順については、データセットのユーザーガイドを参照してください。