データの準備と取り込みのブループリント

データの準備と取り込みブループリントには、データを準備してAdobeExperience Platform に取り込むことができるすべての方法が含まれています。

データ準備には、エクスペリエンスデータモデル(XDM)スキーマへのソースデータのマッピングが含まれます。また、データ変換(日付形式、フィールドの分割/連結/コンバージョン、レコードの結合/キー更新など)の実行も含まれます。データ準備は、顧客データを統合して、集計/フィルタリングされた分析を提供するのに役立ちます。これには、レポート作成や顧客プロファイルの組み立て/データサイエンス/アクティベーションのためのデータ準備が含まれます。

アーキテクチャ

データ準備と取り込みブループリントの参照アーキテクチャ

データ取り込みガードレール

次の図に、AdobeExperience Platform ークフローへのデータ取り込みの平均パフォーマンスガードレールと待ち時間を示します。

Experience Platform データフロー

データ取り込み方法

ストリーミングソース
方法
一般的なユースケース
プロトコル
注意点
Adobe Web/Mobile SDK
  • Web サイトやモバイルアプリからのデータ収集。
  • クライアントサイドの収集に推奨される方法。
プッシュ、HTTP、JSON
  • 1 つの SDK を利用して複数のアドビアプリケーションを実装。
HTTP API コネクタ
  • ストリーミングソース、トランザクション、関連する顧客イベントおよびシグナルからの収集
プッシュ、REST API、JSON
  • データはハブに直接ストリーミングされるので、リアルタイムのエッジセグメント化やイベント転送は行われない。
Edge Network API
  • ストリーミングソース、トランザクション、関連する顧客イベント、およびグローバルに分散されたからのシグナルからの収集 Edge Network
プッシュ、REST API、JSON
  • データは Edge Network を介してストリーミングされます。 Edge でのリアルタイムセグメント化のサポート。
アドビのアプリケーション
  • Adobe Analytics、Marketo、Campaign、Target、AAM の事前実装
プッシュ、ソースコネクタおよび API
  • 従来のアプリケーション SDK を介して Web/Mobile SDK に移行することを推奨。
ストリーミングソースコネクタ
  • エンタープライズイベントストリームの取得。通常、企業データを複数のダウンストリームアプリケーションで共有するために使用。
プッシュ、REST API、JSON
  • XDM 形式でのストリーミングが必要。
ストリーミングソースの SDK
  • HTTP API コネクタと同様に、外部データストリームのセルフサービス設定カードが使用可能。
プッシュ、HTTP API、JSON
  • Edge Network
バッチソース
方法
一般的なユースケース
プロトコル
注意点
Batch Ingestion API
  • 企業が管理するキューからの取り込み。取り込み前のデータのクレンジングと変換。
プッシュ、JSON または Parquet
  • 取り込むバッチとファイルの管理が必要
バッチソースコネクタ
  • クラウドのストレージの場所からファイルを取得する一般的なアプローチ。
  • 一般的な CRM およびマーケティングアプリケーションへのコネクタ。
  • 大量の履歴データの取り込みに最適。
プル、CSV、JSON、Parquet
  • 常にオンではなく、即時取り込み。
  • デルタファイルの取り込みは、最低 15 分ごとに繰り返しチェックを実施。
データランディングゾーン
  • 取り込み用にファイルをプッシュする、アドビでプロビジョニングされたファイル保存場所。
プッシュ、CSV、JSON、Parquet
- ファイルには 7 日間の TTL が提供される
バッチソースの SDK
  • 外部データソースのセルフサービス設定カードを許可。
  • パートナーコネクタまたは、エンタープライズコネクタを設定するためのカスタマイズされたワークフローエクスペリエンスに最適。
プル、REST API、CSV または JSON ファイル
  • 15 分の最小頻度
  • 例:MailChimp、One Trust、Zendesk
取り込みの方法
説明
Web/Mobile SDK

レイテンシ:

  • リアルタイム – 同じページコレクションを Edge Network に
  • プロファイルへのストリーミング取得は、95 パーセンタイルで 15 分未満
  • データレイクへのストリーミングの取り込み(マイクロバッチ 最大 15 分)

ドキュメント:

ストリーミングソース

ストリーミングソース
レイテンシ:

  • リアルタイム – 同じページコレクションを Edge Network に
  • プロファイルへのストリーミングの取り込み 最大 1 分
  • データレイクへのストリーミングの取り込み(マイクロバッチ 最大 15 分)
ストリーミング API

Edge Network Server API (推奨)- Edge Segmentation や
Data Collection Core Service API など、Edge サービスをサポート- Edge サービスをサポートしておらず、ハブに直接ルーティングされます。
レイテンシ:

  • リアルタイム – 同じページコレクションを Edge Network に
  • プロファイルへのストリーミングの取り込み 最大 1 分
  • データレイクへのストリーミングの取り込み(マイクロバッチ 最大 15 分)
  • 7 GB/時間

ドキュメント

ETL ツール

ETL ツールを使用して、Experience Platform に取り込む前にエンタープライズデータを変更および変換します。

レイテンシ:

  • タイミングは外部 ETL ツールのスケジュールに依存し、その後、取り込みに使用される方法に基づいて、標準的な取り込みガードレールが適用されます。
バッチソース
ソースからのスケジュールされた取得
レイテンシ:最大 200 GB/時間

ドキュメント
ビデオチュートリアル
バッチ API

レイテンシ:

  • プロファイルへのバッチ取り込みはサイズおよびトラフィックの負荷に依存 最大 45 分
  • データレイクへのバッチ取り込みはサイズおよびトラフィックの負荷に依存

ドキュメント

アドビアプリケーションコネクタ

Adobe Experience Cloud アプリケーションから供給されるデータを自動的に取り込みます

データ準備方法

データ準備の方法
説明
外部 ETL ツール (Snaplogic、Mulesoft、Informaticaなど )
ETL ツールで複雑な変換を実行し、標準の Experience Platform ​ フローサービス ​ API またはソースコネクタを使用して、結果のデータを取り込みます。
クエリサービス - データ準備
結合、分割、結合、変換、クエリ、フィルターの各データを新しいデータセットにまとめます。Create Table as Select(CTAS)
ドキュメントの使用
XDM マッパーとデータ準備機能(ストリーミングとバッチ)
Experience Platform ータの取り込み中に、ソース属性を CSV 形式または JSON 形式で XDM 属性にマッピングします。
取り込まれたデータに対して、関数を計算します(データの形式、分割、連結など)。
ドキュメント

関連するブログ投稿

recommendation-more-help
045b7d44-713c-4708-a7a6-5dea7cc2546b