UI でクラウドストレージソースのストリーミングデータフローを作成
データフローは、ソースからAdobe Experience Platform データセットにデータを取得して取り込む、スケジュールされたタスクです。 このチュートリアルでは、クラウドストレージソースのストリーミングデータフローを UI で作成する手順について説明します。
このチュートリアルを試す前に、まず、クラウドストレージアカウントと Platform の間に、有効で認証済みの接続を確立する必要があります。 認証済みの接続がまだない場合、ストリーミングクラウドストレージアカウントの認証について詳しくは、次のいずれかのチュートリアルを参照してください。
はじめに
このチュートリアルは、Adobe Experience Platform の次のコンポーネントを実際に利用および理解しているユーザーを対象としています。
-
データフロー:データフローは、Platform 間でデータを移動するデータジョブを表します。データフローは、ソース、Identity Service、Profile、Destinations など、様々なサービスをまたいで設定されます。
-
Data Prep: Data Prep を使用すると、データエンジニアはエクスペリエンスデータモデル(XDM)との間でデータのマッピング、変換、検証をおこなうことができます。 Data Prep は、CSV 取得ワークフローなどのデータ取得プロセスで「マッピング」手順として表示されます。
-
Experience Data Model (XDM) システム:Experience Platform が顧客体験データの整理に使用する標準化されたフレームワーク。
- スキーマ構成の基本:スキーマ構成の主要な原則やベストプラクティスなど、XDM スキーマの基本的な構成要素について学びます。
- スキーマエディターのチュートリアル:スキーマエディター UI を使用してカスタムスキーマを作成する方法を説明します。
-
Real-Time Customer Profile:複数のソースからの集計データに基づいて、統合されたリアルタイムの顧客プロファイルを提供します。
データの追加
ストリーミングクラウドストレージアカウントの認証を作成すると、データを選択 手順が表示され、Platform に取り込むデータストリームを選択するためのインターフェイスが表示されます。
- インターフェイスの左側は、アカウント内で利用可能なデータストリームを表示できるブラウザーです。
- インターフェイスの右側の部分では、JSON ファイルから最大 100 行のデータをプレビューできます。
使用するデータストリームを選択し、「ファイルを選択 を選択して、サンプルスキーマをアップロードします。
スキーマがアップロードされると、プレビューインターフェイスが更新され、アップロードしたスキーマのプレビューが表示されます。 プレビューインターフェイスを使用すると、ファイルの内容と構造を検査できます。 また、 フィールドを検索 ユーティリティを使用して、スキーマ内から特定の項目にアクセスすることもできます。
終了したら、「次へ」を選択します。
マッピング
マッピング 手順が表示され、ソースデータを Platform データセットにマッピングするためのインターフェイスが表示されます。
取り込むインバウンドデータのデータセットを選択します。既存のデータセットを使用することも、新しいデータセットを作成することもできます。
新しいデータセット
データを新しいデータセットに取り込むには、「新しいデータセット」を選択し、表示されたフィールドにデータセットの名前と説明を入力します。 スキーマを追加するには、スキーマを選択 ダイアログボックスで既存のスキーマ名を入力します。 または、スキーマの詳細検索 を選択して、適切なスキーマを検索することもできます。
スキーマを選択 ウィンドウが開き、使用可能なスキーマのリストが表示されます。 リストからスキーマを選択して右側のパネルを更新し、選択したスキーマに固有の詳細(スキーマが Profile に対して有効になっているかどうかについての情報など)を表示します。
使用するスキーマを特定して選択したら、「完了」を選択します。
ターゲットデータセット ページが、データセットの一部として表示された、選択したスキーマで更新されます。 この手順では、データセットの Profile を有効にして、エンティティの属性と動作の全体像を作成できます。 有効なすべてのデータセットのデータは Profile に含まれ、変更はデータフローを保存するときに適用されます。
プロファイルデータセット ボタンを切り替えて、Profile のターゲットデータセットを有効にします。
既存のデータセット
データを既存のデータセットに取り込むには、既存のデータセット を選択してから、データセットアイコンを選択します。
データセットを選択 ダイアログが表示され、使用可能なデータセットのリストから選択できます。 リストからデータセットを選択して右側のパネルを更新し、選択したデータセットに固有の詳細(データセットを Profile に対して有効にできるかどうかに関する情報など)を表示します。
使用するデータセットを特定して選択したら、「完了」を選択します。
データセットを選択したら、「Profile」切り替えスイッチを選択して、Profile 用のデータセットを有効にします。
標準フィールドをマッピング
データセットとスキーマが確立されると、標準フィールドをマッピング インターフェイスが表示され、データのマッピングフィールドを手動で設定できます。
必要に応じて、フィールドを直接マッピングするか、データ準備機能を使用してソースデータを変換して計算値を導き出すかを選択できます。マッパーインターフェイスと計算フィールドの使用に関する包括的な手順については、 データ準備 UI ガイドを参照してください。
ソースデータがマッピングされたら、「次へ」を選択します。
データフローの詳細
データフローの詳細 手順が表示され、新しいデータフローに名前を付けて簡単な説明を入力できます。
データフローの値を指定して「次へ」を選択します。
レビュー
レビュー 手順が表示され、新しいデータフローを作成する前に確認できます。詳細は、次のカテゴリに分類されます。
- 接続:アカウント名、ソースのタイプ、および使用しているストリーミングクラウドストレージソースに固有のその他の情報を表示します。
- データセットの割り当てとフィールドのマッピング:データフローに使用するターゲットデータセットとスキーマを表示します。
データフローをレビューしたら、「終了」を選択し、データフローが作成されるまでしばらく待ちます。
データフローの監視と削除
ストリーミングクラウドストレージのデータフローを作成したら、それを通じて取り込まれるデータを監視できます。 ストリーミングデータフローの監視と削除について詳しくは、 ストリーミングデータフローの監視に関するチュートリアルを参照してください。
次の手順
このチュートリアルでは、クラウドストレージソースからデータをストリーミングするデータフローを正常に作成しました。 受信データは、Real-Time Customer Profile および Data Science Workspace のようなダウンストリームの Platform サービスで使用できるようになりました。詳しくは、次のドキュメントを参照してください。