Azure Data Lake Storage Gen2 接続
概要 overview
このページでは、Azure Data Lake Storage Gen2(ADLS Gen2)データレイクへのライブアウトバウンド接続を作成し、Experience Platform から定期的にデータファイルを書き出す方法を説明します。
APIまたはUIを介してADLS Gen2 ストレージに接続する connect-api-or-ui
- Experience Platform ユーザーインターフェイスを使用してADLS Gen2 ストレージの場所に接続するには、以下の「宛先に接続」と「この宛先にオーディエンスをアクティブ化」の節を参照してください。
- プログラムでADLS Gen2のストレージの場所に接続するには、Flow Service API チュートリアルを使用してファイルベースの宛先にオーディエンスをアクティブ化するを参照してください。
サポートされるオーディエンス supported-audiences
この節では、この宛先に書き出すことができるオーディエンスのタイプについて説明します。
このカテゴリには、Segmentation Serviceを通じて生成されたオーディエンス以外のすべてのオーディエンスのオリジンが含まれます。 様々なオーディエンスの起源について読みます。 次に例を示します。
- カスタムアップロードオーディエンス がCSV ファイルからExperience Platformにをインポートしました。
- 類似オーディエンス,
- 連合オーディエンス,
- Adobe Journey Optimizerなどの他のExperience Platform アプリで生成されたオーディエンス
- その他。
オーディエンスのデータタイプ別にサポートされるオーディエンス:
書き出しのタイプと頻度 export-type-frequency
宛先の書き出しタイプと頻度については、次の表を参照してください。
データセットの書き出し export-datasets
この宛先では、データセットの書き出しをサポートしています。 データセットの書き出しを設定する方法について詳しくは、チュートリアルを参照してください。
- Experience Platform ユーザーインターフェイス を使用してデータセットを エクスポートする方法。
- Flow Service APIを使用してデータセットをプログラムで エクスポートする方法。
書き出されたデータのファイル形式 file-format
オーディエンスデータを書き出すと、Experience Platformは、指定した保存場所に.csv、parquet、または.json個のファイルを作成します。 ファイルについて詳しくは、オーディエンスアクティベーションのチュートリアルの「 サポートされている書き出し用ファイル形式」セクションを参照してください。
データセットを書き出すと、Experience Platformは、指定したストレージの場所に.parquetまたは.json個のファイルを作成します。 ファイルについて詳しくは、データセットの書き出しチュートリアルの「成功したデータセットの書き出しを検証する」セクションを参照してください。
宛先への接続 connect
この宛先に接続するには、宛先設定のチュートリアルの手順に従ってください。宛先の設定ワークフローで、以下の 2 つの節でリストされているフィールドに入力します。
宛先に対する認証 authenticate
宛先に対して認証を行うには、必須フィールドに入力し、Connect to destinationを選択します。
-
URL: Azure Data Lake Storage Gen2のエンドポイント。 エンドポイントパターンは
abfss://<container>@<accountname>.dfs.core.windows.netです。 -
Tenant: アプリケーションを含むテナント情報。
-
Service principal ID: アプリケーションのクライアント ID。
-
Service principal key: アプリケーションのキー。
-
Encryption key: オプションで、RSA形式の公開鍵を添付して、書き出したファイルに暗号化を追加できます。 正しい形式の暗号化キーの例については、以下の画像を参照してください。
宛先の詳細の入力 destination-details
宛先の詳細を設定するには、以下の必須フィールドとオプションフィールドに入力します。UI のフィールドの横のアスタリスクは、そのフィールドが必須であることを示します。
-
Name:この宛先の優先名を入力します。
-
Description:オプション。例えば、この宛先を使用しているキャンペーンを指定できます。
-
Folder path:書き出されたファイルをホストする宛先フォルダーへのパスを入力します。
-
File type:書き出したファイルにExperience Platformで使用する形式を選択します。 CSV オプションを選択する際に、 ファイル形式オプションを設定することもできます。
-
Compression format:書き出したファイルにExperience Platformで使用する圧縮タイプを選択します。
-
Include manifest file:書き出しの場所や書き出しサイズなどの情報を含むマニフェスト JSON ファイルを書き出しに含める場合は、このオプションをオンに切り替えます。 マニフェストの名前は、形式
manifest-<<destinationId>>-<<dataflowRunId>>.jsonを使用して指定されています。 サンプルマニフェストファイル を表示します。 マニフェストファイルには、次のフィールドが含まれます。flowRunId: エクスポートされたファイルを生成した データフロー実行。scheduledTime: ファイルがエクスポートされたUTCの時間。exportResults.sinkPath:書き出されたファイルが格納されているストレージの場所のパス。exportResults.name: エクスポートされたファイルの名前。size:書き出されたファイルのサイズ (バイト単位)。
アラートの有効化 enable-alerts
アラートを有効にすると、宛先へのデータフローのステータスに関する通知を受け取ることができます。リストからアラートを選択して、データフローのステータスに関する通知を受け取るよう登録します。アラートについて詳しくは、UI を使用した宛先アラートの購読についてのガイドを参照してください。
宛先接続の詳細の提供が完了したら、Nextを選択します。
この宛先に対してオーディエンスをアクティブ化 activate
- データをアクティブ化するには、View Destinations、Activate Destinations、View ProfilesおよびView Segments アクセス制御権限が必要です。 アクセス制御の概要を参照するか、製品管理者に問い合わせて必要な権限を取得してください。
- IDをエクスポートするには、View Identity Graph アクセス制御権限が必要です。
{width="100" modal="regular"}
この宛先に対するオーディエンスのアクティブ化の手順については、 バッチプロファイル書き出し宛先に対するオーディエンスデータのアクティブ化を参照してください。
スケジュール設定 scheduling
Scheduling手順では、宛先に対して書き出しスケジュール Azure Data Lake Storage Gen2を設定でき、書き出したファイルの名前を設定することもできます。
属性と ID のマッピング map
Mapping ステップでは、プロファイルにエクスポートする属性フィールドとID フィールドを選択できます。 また、書き出したファイル内のヘッダーを選択して、任意のわかりやすい名前に変更することもできます。詳しくは、「バッチの宛先をアクティベート」UI チュートリアルのマッピング手順を参照してください。
データの正常な書き出しの検証 exported-data
データが正常に書き出されたかどうかを確認するには、Azure Data Lake Storage Gen2 ストレージを確認し、書き出されたファイルに想定されるプロファイル母集団が含まれていることを確認してください。