データ準備と取り込みのブループリント

データ準備と取り込みブループリントは、データを準備して Adobe Experience Platform に取り込むためのすべての方法を網羅しています。

データ準備には、エクスペリエンスデータモデル(XDM)スキーマへのソースデータのマッピングが含まれます。また、データ変換(日付形式、フィールドの分割/連結/コンバージョン、レコードの結合/キー更新など)の実行も含まれます。データ準備は、顧客データを統合して、集計/フィルタリングされた分析を提供するのに役立ちます。これには、レポート作成や顧客プロファイルの組み立て/データサイエンス/アクティベーションのためのデータ準備が含まれます。

アーキテクチャ

データ準備と取り込みブループリントの参照アーキテクチャ

データ取り込みガードレール

以下の図に、Adobe Experience Platform にデータを取り込む際の平均パフォーマンスのガードレールと待ち時間を示します。

Experience Platform データフロー

データ取り込み方法

ストリーミングソース

方法

一般的なユースケース

プロトコル

注意点

Adobe Web/Mobile SDK

  • Web サイトやモバイルアプリからのデータ収集。
  • クライアントサイドの収集に推奨される方法。

プッシュ、HTTP、JSON

  • 1 つの SDK を利用して複数のアドビアプリケーションを実装。

HTTP API コネクタ

  • ストリーミングソース、トランザクション、関連する顧客イベントおよびシグナルからの収集

プッシュ、REST API、JSON

  • データはハブに直接ストリーミングされるので、リアルタイムのエッジセグメント化やイベント転送は行われない。

Edge Network API

  • ストリーミングソース、トランザクション、関連する顧客イベントおよびシグナルからの収集をグローバルに分散した Edge ネットワークから実行

プッシュ、REST API、JSON

  • データは Edge ネットワークを通じてストリーミングされる。Edge でのリアルタイムセグメント化のサポート。

アドビのアプリケーション

  • Adobe Analytics、Marketo、Campaign、Target、AAM の事前実装

プッシュ、ソースコネクタおよび API

  • 従来のアプリケーション SDK を介して Web/Mobile SDK に移行することを推奨。

ストリーミングソースコネクタ

  • エンタープライズイベントストリームの取得。通常、企業データを複数のダウンストリームアプリケーションで共有するために使用。

プッシュ、REST API、JSON

  • XDM 形式でのストリーミングが必要。

ストリーミングソースの SDK

  • HTTP API コネクタと同様に、外部データストリームのセルフサービス設定カードが使用可能。

プッシュ、HTTP API、JSON

  • Edge ネットワーク

バッチソース

方法

一般的なユースケース

プロトコル

注意点

Batch Ingestion API

  • 企業が管理するキューからの取り込み。取り込み前のデータのクレンジングと変換。

プッシュ、JSON または Parquet

  • 取り込むバッチとファイルの管理が必要

バッチソースコネクタ

  • クラウドのストレージの場所からファイルを取得する一般的なアプローチ。
  • 一般的な CRM およびマーケティングアプリケーションへのコネクタ。
  • 大量の履歴データの取り込みに最適。

プル、CSV、JSON、Parquet

  • 常にオンではなく、即時取り込み。
  • デルタファイルの取り込みは、最低 15 分ごとに繰り返しチェックを実施。

データランディングゾーン

  • 取り込み用にファイルをプッシュする、アドビでプロビジョニングされたファイル保存場所。

プッシュ、CSV、JSON、Parquet

- ファイルには 7 日間の TTL が提供される

バッチソースの SDK

  • 外部データソースのセルフサービス設定カードを許可。
  • パートナーコネクタまたは、エンタープライズコネクタを設定するためのカスタマイズされたワークフローエクスペリエンスに最適。

プル、REST API、CSV または JSON ファイル

  • 15 分の最小頻度
  • 例:MailChimp、One Trust、Zendesk

 

取り込みの方法 説明
Web/Mobile SDK レイテンシ:
  • リアルタイム - Edge Network への同じページの収集
  • プロファイルへのストリーミングの取り込み 最大 1 分
  • データレイクへのストリーミングの取り込み(マイクロバッチ 最大 15 分)
ドキュメント:
ストリーミングソース ストリーミングソース
レイテンシ:
  • リアルタイム - Edge Network への同じページの収集
  • プロファイルへのストリーミングの取り込み 最大 1 分
  • データレイクへのストリーミングの取り込み(マイクロバッチ 最大 15 分)
ストリーミング API Edge Network Server API(推奨) - Edge セグメント化を含む Edge サービスをサポートしますが、
データ収集コアサービス API - は Edge サービスをサポートしておらず、ハブに直接ルートします。
レイテンシ:
  • リアルタイム - Edge Network への同じページの収集
  • プロファイルへのストリーミングの取り込み 最大 1 分
  • データレイクへのストリーミングの取り込み(マイクロバッチ 最大 15 分)
  • 7 GB/時間
ドキュメント
ETL ツール Experience Platform に取り込む前に、ETL ツールを使用してエンタープライズデータを変更および変換します。

レイテンシ:
  • タイミングは外部 ETL ツールのスケジュールに依存し、その後、取り込みに使用される方法に基づいて、標準的な取り込みガードレールが適用されます。
バッチソース ソースからのスケジュールされた取得
レイテンシ:最大 200 GB/時間

ドキュメント
ビデオチュートリアル
バッチ API レイテンシ:
  • プロファイルへのバッチ取り込みはサイズおよびトラフィックの負荷に依存 最大 45 分
  • データレイクへのバッチ取り込みはサイズおよびトラフィックの負荷に依存
ドキュメント
アドビアプリケーションコネクタ Adobe Experience Cloud アプリケーションから供給されるデータを自動的に取り込みます

データ準備方法

データ準備の方法 説明
外部 ETL ツール (Snaplogic、Mulesoft、Informaticaなど ) ETL ツールで複雑な変換を実行し、標準 Experience Platform フローサービス API またはソースコネクタを使用して、結果のデータを取り込みます。
クエリサービス - データ準備 結合、分割、結合、変換、クエリ、フィルターの各データを新しいデータセットにまとめます。Create Table as Select(CTAS)
ドキュメントの使用
XDM マッパーとデータ準備機能(ストリーミングとバッチ) Experience Platform の取り込み時に、CSV 形式または JSON 形式のソース属性を XDM 属性にマップします。
取り込まれたデータに対して、関数を計算します(データの形式、分割、連結など)。
ドキュメント

関連するブログ投稿

このページ