UI でクラウドストレージソースのストリーミングデータフローを作成

データフローは、ソースからAdobe Experience Platform データセットにデータを取得して取り込む、スケジュールされたタスクです。 このチュートリアルでは、クラウドストレージソースのストリーミングデータフローを UI で作成する手順について説明します。

このチュートリアルを試す前に、まず、クラウドストレージアカウントと Platform の間に、有効で認証済みの接続を確立する必要があります。 認証済みの接続がまだない場合、ストリーミングクラウドストレージアカウントの認証について詳しくは、次のいずれかのチュートリアルを参照してください。

はじめに

このチュートリアルは、Adobe Experience Platform の次のコンポーネントを実際に利用および理解しているユーザーを対象としています。

  • データフロー:データフローは、Platform 間でデータを移動するデータジョブを表します。データフローは、ソース、Identity Service、Profile、Destinations など、様々なサービスをまたいで設定されます。

  • Data Prep: Data Prep を使用すると、データエンジニアはエクスペリエンスデータモデル(XDM)との間でデータのマッピング、変換、検証をおこなうことができます。 Data Prep は、CSV 取得ワークフローなどのデータ取得プロセスで「マッピング」手順として表示されます。

  • Experience Data Model (XDM) システム:Experience Platform が顧客体験データの整理に使用する標準化されたフレームワーク。

  • Real-Time Customer Profile:複数のソースからの集計データに基づいて、統合されたリアルタイムの顧客プロファイルを提供します。

データの追加

NOTE
特定のイベントハブについて、コンシューマーグループごとに 1 つのソースデータフローのみを作成できます。

ストリーミングクラウドストレージアカウントの認証を作成すると、データを選択 手順が表示され、Platform に取り込むデータストリームを選択するためのインターフェイスが表示されます。

  • インターフェイスの左側は、アカウント内で利用可能なデータストリームを表示できるブラウザーです。
  • インターフェイスの右側の部分では、JSON ファイルから最大 100 行のデータをプレビューできます。

インターフェイス

使用するデータストリームを選択し、「ファイルを選択 を選択して、サンプルスキーマをアップロードします。

TIP
データが XDM に準拠している場合、サンプルスキーマのアップロードをスキップし、「次へ」を選択して続行できます。

select-stream

スキーマがアップロードされると、プレビューインターフェイスが更新され、アップロードしたスキーマのプレビューが表示されます。 プレビューインターフェイスを使用すると、ファイルの内容と構造を検査できます。 また、​ フィールドを検索 ​ ユーティリティを使用して、スキーマ内から特定の項目にアクセスすることもできます。

終了したら、「次へ」を選択します。

schema-preview

マッピング

マッピング 手順が表示され、ソースデータを Platform データセットにマッピングするためのインターフェイスが表示されます。

取り込むインバウンドデータのデータセットを選択します。既存のデータセットを使用することも、新しいデータセットを作成することもできます。

新しいデータセット

データを新しいデータセットに取り込むには、「新しいデータセット」を選択し、表示されたフィールドにデータセットの名前と説明を入力します。 スキーマを追加するには、スキーマを選択 ダイアログボックスで既存のスキーマ名を入力します。 または、スキーマの詳細検索 を選択して、適切なスキーマを検索することもできます。

new-dataset

​ スキーマを選択 ​ ウィンドウが開き、使用可能なスキーマのリストが表示されます。 リストからスキーマを選択して右側のパネルを更新し、選択したスキーマに固有の詳細(スキーマが Profile に対して有効になっているかどうかについての情報など)を表示します。

使用するスキーマを特定して選択したら、「完了」を選択します。

select-schema

​ ターゲットデータセット ​ ページが、データセットの一部として表示された、選択したスキーマで更新されます。 この手順では、データセットの Profile を有効にして、エンティティの属性と動作の全体像を作成できます。 有効なすべてのデータセットのデータは Profile に含まれ、変更はデータフローを保存するときに適用されます。

プロファイルデータセット ボタンを切り替えて、Profile のターゲットデータセットを有効にします。

new-profile

既存のデータセット

データを既存のデータセットに取り込むには、既存のデータセット を選択してから、データセットアイコンを選択します。

existing-dataset

データセットを選択 ダイアログが表示され、使用可能なデータセットのリストから選択できます。 リストからデータセットを選択して右側のパネルを更新し、選択したデータセットに固有の詳細(データセットを Profile に対して有効にできるかどうかに関する情報など)を表示します。

使用するデータセットを特定して選択したら、「完了」を選択します。

select-dataset

データセットを選択したら、「Profile」切り替えスイッチを選択して、Profile 用のデータセットを有効にします。

existing-profile

標準フィールドをマッピング

データセットとスキーマが確立されると、標準フィールドをマッピング インターフェイスが表示され、データのマッピングフィールドを手動で設定できます。

TIP
Platform は、選択したターゲットスキーマまたはデータセットに基づいて、自動マッピングされたフィールドに対してインテリジェントなレコメンデーションを提供します。 マッピングルールは、ユースケースに合わせて手動で調整できます。

必要に応じて、フィールドを直接マッピングするか、データ準備機能を使用してソースデータを変換して計算値を導き出すかを選択できます。マッパーインターフェイスと計算フィールドの使用に関する包括的な手順については、 データ準備 UI ガイドを参照してください。

ソースデータがマッピングされたら、「次へ」を選択します。

マッピング

データフローの詳細

データフローの詳細 手順が表示され、新しいデータフローに名前を付けて簡単な説明を入力できます。

データフローの値を指定して「次へ」を選択します。

dataflow-detail

レビュー

レビュー ​手順が表示され、新しいデータフローを作成する前に確認できます。詳細は、次のカテゴリに分類されます。

  • 接続:アカウント名、ソースのタイプ、および使用しているストリーミングクラウドストレージソースに固有のその他の情報を表示します。
  • データセットの割り当てとフィールドのマッピング:データフローに使用するターゲットデータセットとスキーマを表示します。

データフローをレビューしたら、「終了」を選択し、データフローが作成されるまでしばらく待ちます。

レビュー

データフローの監視と削除

ストリーミングクラウドストレージのデータフローを作成したら、それを通じて取り込まれるデータを監視できます。 ストリーミングデータフローの監視と削除について詳しくは、 ストリーミングデータフローの監視に関するチュートリアルを参照してください。

次の手順

このチュートリアルでは、クラウドストレージソースからデータをストリーミングするデータフローを正常に作成しました。 受信データは、Real-Time Customer Profile および Data Science Workspace のようなダウンストリームの Platform サービスで使用できるようになりました。詳しくは、次のドキュメントを参照してください。

recommendation-more-help
337b99bb-92fb-42ae-b6b7-c7042161d089