Azure Data Lake Storage Gen2 接続
概要 overview
このページでは、Azure Data Lake Storage Gen2(ADLS Gen2)データレイクへのライブアウトバウンド接続を作成し、Experience Platform から定期的にデータファイルを書き出す方法を説明します。
に接続 ADLS Gen2 api または UI を介したストレージ connect-api-or-ui
- に接続するには ADLS Gen2 ストレージの場所 Platform ユーザーインターフェイスを使用して、セクションを参照してください 宛先への接続 および この宛先に対してオーディエンスをアクティブ化 下。
- に接続するには ADLS Gen2 ストレージの場所をプログラムで読み取る Flow Service API チュートリアルを使用して、ファイルベースの宛先に対するオーディエンスをアクティブ化します.
サポートされるオーディエンス supported-audiences
この節では、この宛先に書き出すことができるオーディエンスのタイプについて説明します。
書き出しのタイプと頻度 export-type-frequency
宛先の書き出しのタイプと頻度について詳しくは、以下の表を参照してください。
データセットを書き出し export-datasets
この宛先では、データセットの書き出しをサポートしています。 データセットの書き出しを設定する方法について詳しくは、次のチュートリアルを参照してください。
書き出されたデータのファイル形式 file-format
書き出し時 オーディエンスデータ、Platform は .csv
, parquet
、または .json
ファイルは、指定したストレージの場所にあります。 ファイルの詳細については、を参照してください 書き出しでサポートされるファイル形式 Audience Activation チュートリアルの「」の節。
書き出し時 データセット、Platform は .parquet
または .json
ファイルは、指定したストレージの場所にあります。 ファイルの詳細については、を参照してください データセットの正常な書き出しの確認 データセットの書き出しに関するチュートリアルの「」節。
宛先への接続 connect
この宛先に接続するには、宛先設定のチュートリアルの手順に従ってください。宛先の設定ワークフローで、以下の 2 つの節でリストされているフィールドに入力します。
宛先に対する認証 authenticate
宛先を認証するには、必須フィールドに入力し、「宛先に接続」を選択します。
-
URL:Azure Data Lake Storage Gen2 のエンドポイント。エンドポイントパターンは
abfss://<container>@<accountname>.dfs.core.windows.net
です。 -
テナント:アプリケーションを含んだテナント情報。
-
サービスプリンシパル ID:アプリケーションのクライアント ID。
-
サービスプリンシパルキー:アプリケーションのキー。
-
暗号化キー:必要に応じて、RSA 形式の公開鍵を添付して、書き出したファイルに暗号化を追加できます。 正しい形式の暗号化キーの例については、以下の画像を参照してください。
宛先の詳細の入力 destination-details
宛先の詳細を設定するには、以下の必須フィールドとオプションフィールドに入力します。UI のフィールドの横のアスタリスクは、そのフィールドが必須であることを示します。
-
名前:この宛先に希望する名前を入力します。
-
説明:オプション。例えば、この宛先を使用しているキャンペーンを指定できます。
-
フォルダーパス:書き出したファイルをホストする宛先フォルダーへのパス。
-
ファイルタイプ:書き出したファイルでExperience Platformが使用するフォーマットを選択します。 を選択した場合 CSV オプションを使用すると、次のこともできます ファイル形式オプションの設定.
-
圧縮フォーマット:書き出したファイルにExperience Platformで使用する圧縮タイプを選択します。
-
マニフェストファイルを含める:書き出しに、書き出しの場所、書き出しサイズなどに関する情報を含んだマニフェスト JSON ファイルを含める場合は、このオプションをオンに切り替えます。 マニフェストには、形式を使用して名前を付けます
manifest-<<destinationId>>-<<dataflowRunId>>.json
. を表示 サンプルマニフェストファイル. マニフェストファイルには、次のフィールドが含まれています。flowRunId
:です データフローの実行 書き出されたファイルを生成した。scheduledTime
:ファイルが書き出された時間(UTC 単位)。exportResults.sinkPath
:書き出したファイルを格納するストレージの場所のパス。exportResults.name
:書き出すファイルの名前。size
:書き出したファイルのサイズ(バイト単位)。
アラートの有効化 enable-alerts
アラートを有効にすると、宛先へのデータフローのステータスに関する通知を受け取ることができます。リストからアラートを選択して、データフローのステータスに関する通知を受け取るよう登録します。アラートについて詳しくは、UI を使用した宛先アラートの購読についてのガイドを参照してください。
宛先接続の詳細の入力を終えたら「次へ」を選択します。
この宛先に対してオーディエンスをアクティブ化 activate
参照: プロファイル書き出しのバッチ宛先に対するオーディエンスデータの有効化 この宛先に対してオーディエンスをアクティブ化する手順については、を参照してください。
スケジュール設定 scheduling
スケジュール設定 手順では、Azure Data Lake Storage Gen2 宛先の書き出しスケジュールを設定し、書き出したファイルの名前を設定することもできます。
属性と ID のマッピング map
マッピング 手順では、プロファイルに書き出す属性および ID フィールドを選択できます。 また、書き出したファイル内のヘッダーを選択して、任意のわかりやすい名前に変更することもできます。詳しくは、「バッチの宛先をアクティベート」UI チュートリアルのマッピング手順を参照してください。
データの正常な書き出しの検証 exported-data
データが正常に書き出されたかどうかを確認するには、Azure Data Lake Storage Gen2 ストレージを確認し、書き出されたファイルに想定されるプロファイル母集団が含まれていることを確認してください。