データセットの概要

Adobe Experience Platformに正常に取り込まれたすべてのデータは、データセットとして Data Lake 内に保持されます。 データセットは、通常、スキーマ(列)とフィールド(行)を含むテーブルであるデータコレクションのストレージと管理をおこなう構成体です。データセットには、保存するデータの様々な側面を記述したメタデータも含まれます。

このドキュメントでは、Experience Platform のデータセットの概要を説明します。

データセットの作成とメタデータの追跡

Catalog Service は、内のデータの場所と系列のレコードのシステムで、 Experience Platformデータセットの作成と管理に使用されます。Catalog は、データセットが準拠する ( Experience Data Model XDM) スキーマへの参照(次の節で説明)と、そのデータセットに取り込まれるレコードの数を含む、各データセットのメタデータを追跡します。

詳しくは、「カタログサービスの概要」を参照してください。

データセットデータに対する制限の適用

Experience Data Model (XDM) は、顧客体験データを整理する際に使用する Platform 標準化されたフレームワークです。Platform に取り込まれるすべてのデータは、事前定義済みの XDM スキーマに準拠してから、データセットとして Data Lake に保持する必要があります。

すべてのデータセットには、保存できるデータの形式と構造を制限する XDM スキーマへの参照が含まれています。データセットの XDM スキーマに準拠していないデータセットにデータをアップロードしようとすると、データの取得に失敗します。

XDM について詳しくは、「XDM システムの概要」を参照してください。

データセットへのデータの取り込み

Adobe Experience Platformデータ取り込みは、Platform が様々なソースからデータを取り込む複数の方法を表します。 取得方法に関係なく、正常に取り込まれたデータはすべてバッチファイルに変換されます。バッチとは、1 つの単位として取り込まれる 1 つ以上のファイルで構成されるデータの単位です。次に、これらのバッチファイルは専用のデータセットに追加され、Data Lake 内で保持されます。

詳しくは、「データ取得の概要」を参照してください。

データセットへの使用状況ラベルの適用

Adobe Experience Platform Data Governance では、データの使用に適した規制、制限、ポリシーへのコンプライアンスを確保するために、顧客データを管理できます。 Data Governance フレームワークを使用すると、使用状況ラベルを適用して、そのデータに適用される使用状況ポリシーに従ってデータを分類できます。

データ使用状況ラベルは、データセット全体または個々のデータセットフィールドに適用できます。データセットレベルで追加されたラベルは、そのデータセット内のすべてのフィールドに継承されます。

このサービスについて詳しくは、「データガバナンスの概要」を参照してください。Platform で使用状況ラベルを使用する手順については、次のガイドを参照してください。

ダウンストリーム Platform サービスのデータセット

データセットを使用して取り込んだデータを保存すると、ダウンストリーム Platform サービスでそれらのデータセットが使用され、顧客プロファイルの更新や機械学習を通じたインサイトの取得などがおこなわれます。

様々な操作にデータセットを使用するダウンストリームサービスのリストを次に示します。詳しくは、各サービスのドキュメントを参照してください。

  • Data Access API:データセット内に保存されたファイルの内容にアクセスしてダウンロードできます。
  • Adobe Experience Platform ID サービス:デバイスやシステム間で ID をブリッジし、準拠する XDM スキーマで定義された ID フィールドに基づいてデータセットをリンクします。
  • Real-time Customer Profile:を活用し Identity Service て、データセットから詳細な顧客プロファイルをリアルタイムで作成します。Real-time Customer Profile からデータを取り込み、顧 Data Lake 客プロファイルを独自の別々のデータストアに保持します。
  • Adobe Experience Platform Segmentation Service:セグメントを作成し、データからオーディエンスを生成で Real-time Customer Profile きます。その後、これらのオーディエンスは、Data Lake 内の独自のデータセットにエクスポートできます。
  • Adobe Experience Platform Data Science Workspace:機械学習と人工知能を使用して、大規模なデータセットからインサイトを引き出します。
  • Adobe Experience Platformクエリサービス:標準の SQL を使用して、でデータをクエリし、内の任意のデータセットを結 Experience Platform合 Data Lake し、クエリ結果を新しいデータセットとして取得して、レポート、またはで使用で Data Science Workspaceきま Real-time Customer Profileす。

次の手順

このドキュメントでは、Experience Platform のデータセットの主な使用方法と、データセットを利用する様々な Platform サービスについて説明しました。 Platform でデータセットを使用する多くの方法の詳細については、この概要でリンクされているサービスドキュメントを参照してください。

Experience Platform UI 内でデータセットを操作する手順については、『 データセットユーザガイド 』を参照してください。

このページ