データ取り込みの概要

Adobe Experience Platformでは、データ取得とは、様々なソースからストレージメディアにデータを転送し、そこで組織がアクセス、使用、分析できるようにすることです。 Experience Platformのデータ取り込みは、ストリーミング取り込みバッチ取り込み の 2 つの主なカテゴリにグループ化できます。

ストリーミングとバッチの取り込みでは、データをExperience Platformに取り込むために使用できる様々な方法があります。 例えば、様々な ソース を使用し、これらのソースに接続してデータをExperience Platformに取り込みます。

データをExperience Platformに取り込む様々な方法の概要については、このドキュメントを参照してください。

ストリーミング取り込み streaming

ストリーミング取得を使用して、クライアントおよびサーバーサイドデバイスから、リアルタイムでExperience Platformにデータを送信できます。 Experience Platformでは、受信したエクスペリエンスデータをストリーミングするためのデータインレットの使用をサポートしています。このデータインレットは、データレイク内のストリーミング対応データセットで保持されます。 データインレットは、収集したデータを自動的に認証するように設定でき、信頼できるソースからのデータであることを確認できます。

詳しくは、​ ストリーミング取得の概要 ​ を参照してください。

バッチ取得 batch

Experience Platformでは、バッチは、一定期間にわたって収集された一連のデータで、1 つのユニットとして一緒に処理されます。 データセットは、バッチで構成されます。 バッチ取り込みを使用して、データをバッチファイルとしてExperience Platformに取り込むことができます。 取り込まれたバッチには、正常に取り込まれたレコードの数と、失敗したレコードの数、および関連するエラーメッセージを示すメタデータが提供されます。

フラットな CSV ファイル(XDM スキーマにマッピングされたもの)や parquet ファイルなど、手動でアップロードされたデータファイルは、この方法を使用して取り込む必要があります。

詳しくは、​ バッチ取得の概要 ​ を参照してください。

ソース sources

Experience Platform Sources に接続してデータを取り込むこともできます。 Experience Platformには、接続してデータを取り込むことができる様々なデータソースのカタログが用意されています。 これらのソースには、Adobe Analytics ソースやMarketo Engage ソースなどのネイティブのAdobe アプリケーションを使用できます。 Amazon S3 ソースや Google Cloud Storage ソースなど、サードパーティのソースに接続することもできます。

ソースは、クラウドストレージ、データベース、CRM システムなど、様々なカテゴリにグループ化されます。 特定のソースは、バッチまたはストリーミング取得をサポートする場合があります。

ソースを使用すると、様々なデータソースや、様々なユースケースカテゴリからデータを取り込むことができます。 さらに、ソースを介したデータ取り込みでは、外部データソースに対して認証を行い、取り込みスケジュールを設定し、取り込みスループットを管理することができます。

詳しくは、​ ソースの概要 ​ を参照してください。

ML 支援スキーマの作成 ml-assisted-schema-creation

新しいデータソースをすばやく統合するために、機械学習アルゴリズムを使用して、サンプルデータからスキーマを生成できるようになりました。 この自動化により、正確なスキーマの作成が簡素化され、エラーが減り、データ収集から分析およびインサイトに至るプロセスが迅速化されます。

このワークフローについて詳しくは 🔗 ML-ASSISTED schema creation guide」を参照してください。

データ準備 data-prep

データ準備は取り込み方法ではありませんが、データ取り込みプロセスの重要な部分です。 データフローを作成してデータをExperience Platformに取り込む前に、データ準備関数を使用して、エクスペリエンスデータモデル(XDM)との間でデータのマッピング、変換および検証を行います。 データ準備は、データ取得プロセス中にExperience Platform ユーザーインターフェイスで「マッピング」手順として表示されます。

詳しくは、​ データ準備の概要 ​ を参照してください。

ストリーミング取り込み方法 streaming-ingestion-methods

次の表に、ストリーミングデータをExperience Platformに取り込む際に使用できる様々な方法の概要を示します。

ストリーミングソース
メソッド
一般的なユースケース
プロトコル
注意点
Adobe Web/モバイルSDK
  • Web サイトやモバイルアプリからのデータ収集。
  • クライアントサイドの収集に推奨される方法。
プッシュ,HTTP, JSON
  • 1 つのSDKを活用して複数のAdobe アプリケーションを実装します。
HTTP API コネクタ
  • ストリーミングソース、トランザクション、関連する顧客イベントおよびシグナルからの収集。
プッシュ、REST API、JSON
  • 生データまたは XDM データは、リアルタイムのEdge セグメント化やイベント転送を使用せずに、ハブに直接ストリーミングされます。
Edge Network API
  • ストリーミングソース、トランザクション、関連する顧客イベント、およびグローバルに分散した Edge Network からのシグナルからの収集。
プッシュ、REST API、JSON
  • データは Edge Network を介してストリーミングされます。 Edgeでのリアルタイムのセグメント化とイベント転送のサポート。
アドビアプリケーション
  • Adobe Analytics、Marketo Engage、Adobe Campaign Managed Services、Adobe Target、Adobe Audience Managerなどのアプリケーションからのデータ取得
プッシュ、Source コネクタ、API
  • 推奨されるアプローチは、従来のアプリケーション SDK を使用する代わりに、Web/Mobile SDKに移行することです。
ストリーミングソース
  • エンタープライズイベントストリームの取り込み。通常、複数のダウンストリームアプリケーションでエンタープライズデータを共有するために使用します。
プッシュ、REST API、JSON
  • データは JSON 形式でストリーミングされ、XDM スキーマにマッピングできます。

ストリーミングソースSDK

  • SDKをストリーミングするセルフサービスソースのセルフサービス機能を使用して、独自のデータソースをExperience Platform ソースカタログに統合します。
プッシュ,HTTP API, JSON
  • パートナー統合ストリーミングソースの例としては、Braze、Pendo、RainFocus があります。

バッチ取り込み方法 batch-ingestion-methods

次の表に、バッチデータをExperience Platformに取り込むために使用できる様々な方法の概要を示します。

バッチソース
メソッド
一般的なユースケース
プロトコル
注意点
バッチ取得 API
  • エンタープライズ管理キューからの取得。 取り込み前にデータを準備およびフォーマットする必要がある場合は、バッチ取り込みを使用します。
プッシュ、JSON または Parquet
  • 取り込むバッチとファイルを管理する必要があります。
バッチソース
  • クラウドストレージ、CRM、マーケティング自動化アプリケーションからデータを取り込むための一般的なアプローチ。
  • 大量の履歴データの取り込みに最適です。
プル、CSV、JSON、Parquet
  • 事前設定されたスケジュールされた間隔に基づいてSourceを取得します。
Data Landing Zone
  • Adobeがプロビジョニングしたクラウドベースのファイルストレージ。 サンドボックスごとに 1 つのデータランディングゾーンコンテナにアクセスできます。
  • 後でExperience Platformに取り込むために、ファイルをデータランディングゾーンにプッシュします。
プッシュ,CSV, JSON, Parquet
  • Experience Platformでは、データランディングゾーンコンテナにアップロードされるすべてのファイルおよびフォルダーに対して、厳密に 7 日間の有効期限が適用されます。 すべてのファイルとフォルダーは、7 日後に削除されます。
バッチソースSDK
  • セルフサービスソースバッチ SDKのセルフサービス機能を使用して、独自のデータソースをExperience Platform ソースカタログに統合します。
  • パートナーコネクタまたはエンタープライズコネクタの設定に合わせたワークフローエクスペリエンスに最適です。
プル、REST API、CSV または JSON
  • パートナー統合バッチソースの例としては、Mailchimp、OneTrust、Zendesk などがあります

次の手順とその他のリソース

このドキュメントでは、Experience Platform での Data Ingestion の様々な側面について簡単に説明しました。各取り込み方法の概要ドキュメントを引き続き参照して、それぞれの機能、ユースケース、ベストプラクティスをよく理解してください。また、次の取り込みの概要ビデオを見ることで、理解を補うこともできます。取り込んだレコードのメタデータを Experience Platform で追跡する方法について詳しくは、Catalog Service の概要 を参照してください。

WARNING
次のビデオで使用されている「統合プロファイル」という用語は、今は使われていません。"Profile"または"Real-Time Customer Profile"という用語は、Experience Platform のドキュメントで使用されている正しい用語です。最新の機能については、ドキュメントを参照してください。
recommendation-more-help
2ee14710-6ba4-4feb-9f79-0aad73102a9a