Azure Data Lake Storage Gen2 接続
概要 overview
このページでは、Azure Data Lake Storage Gen2(ADLS Gen2)データレイクへのライブアウトバウンド接続を作成し、Experience Platform から定期的にデータファイルを書き出す方法を説明します。
次に接続: ADLS Gen2 API または UI を介したストレージ connect-api-or-ui
- 次の URL に接続するには: ADLS Gen2 ストレージの場所 Platform ユーザーインターフェイスを使用して、「 」セクションを読みます。 宛先に接続 および この宛先に対するオーディエンスをアクティブ化 下
- 次の URL に接続するには: ADLS Gen2 ストレージの場所をプログラムで設定し、読み取る フローサービス API のチュートリアルを使用して、ファイルベースの宛先に対するオーディエンスをアクティブ化します.
サポートされるオーディエンス supported-audiences
この節では、この宛先に書き出すことができるオーディエンスのタイプについて説明します。
書き出しのタイプと頻度 export-type-frequency
宛先の書き出しのタイプと頻度について詳しくは、以下の表を参照してください。
データセットを書き出し export-datasets
この宛先では、データセットの書き出しをサポートしています。 データセットエクスポートの設定方法について詳しくは、次のチュートリアルを参照してください。
エクスポートするデータのファイル形式 file-format
書き出し時 オーディエンスデータ、Platform は .csv
, parquet
または .json
ファイルを指定したストレージの場所に保存します。 ファイルについて詳しくは、 書き出しでサポートされるファイル形式 の節を参照してください。
書き出し時 データセット、Platform は .parquet
または .json
ファイルを指定したストレージの場所に保存します。 ファイルについて詳しくは、 データセットの書き出しが成功したことを確認する 「データセットの書き出し」チュートリアルの節を参照してください。
宛先への接続 connect
この宛先に接続するには、宛先設定のチュートリアルの手順に従ってください。宛先の設定ワークフローで、以下の 2 つの節でリストされているフィールドに入力します。
宛先に対する認証 authenticate
宛先を認証するには、必須フィールドに入力し、「宛先に接続」を選択します。
-
URL:Azure Data Lake Storage Gen2 のエンドポイント。エンドポイントパターンは
abfss://<container>@<accountname>.dfs.core.windows.net
です。 -
テナント:アプリケーションを含んだテナント情報。
-
サービスプリンシパル ID:アプリケーションのクライアント ID。
-
サービスプリンシパルキー:アプリケーションのキー。
-
暗号化キー:必要に応じて、RSA 形式の公開鍵を添付して、書き出したファイルに暗号化を追加できます。 正しい形式の暗号化キーの例については、以下の画像を参照してください。
宛先の詳細の入力 destination-details
宛先の詳細を設定するには、以下の必須フィールドとオプションフィールドに入力します。UI のフィールドの横のアスタリスクは、そのフィールドが必須であることを示します。
-
名前:この宛先に希望する名前を入力します。
-
説明:オプション。例えば、この宛先を使用しているキャンペーンを指定できます。
-
フォルダーパス:書き出したファイルをホストする宛先フォルダーへのパス。
-
ファイルタイプ:書き出したファイルに使用する形式Experience Platformを選択します。 選択時に、 CSV オプションを選択する場合は、 ファイル形式設定オプションの設定.
-
圧縮形式:書き出したファイルにExperience Platformが使用する圧縮タイプを選択します。
-
マニフェストファイルを含める:書き出しの場所や書き出しサイズなどに関する情報を含むマニフェスト JSON ファイルを書き出しに含める場合は、このオプションをオンに切り替えます。 マニフェストの名前は、形式を使用して付けられます
manifest-<<destinationId>>-<<dataflowRunId>>.json
. を表示します。 サンプルマニフェストファイル. マニフェストファイルには、次のフィールドが含まれます。flowRunId
: データフローの実行 書き出されたファイルを生成したscheduledTime
:ファイルが書き出されたときの UTC 時刻 (UTC)。exportResults.sinkPath
:書き出されたファイルが格納されるストレージの場所のパス。exportResults.name
:書き出されたファイルの名前。size
:書き出されるファイルのサイズ(バイト単位)。
アラートの有効化 enable-alerts
アラートを有効にすると、宛先へのデータフローのステータスに関する通知を受け取ることができます。リストからアラートを選択して、データフローのステータスに関する通知を受け取るよう登録します。アラートについて詳しくは、UI を使用した宛先アラートの購読についてのガイドを参照してください。
宛先接続の詳細の入力を終えたら「次へ」を選択します。
この宛先に対してオーディエンスをアクティブ化 activate
詳しくは、 プロファイルの一括書き出し先に対するオーディエンスデータのアクティブ化 を参照してください。
スケジュール設定 scheduling
スケジュール設定 手順では、Azure Data Lake Storage Gen2 宛先の書き出しスケジュールを設定し、書き出したファイルの名前を設定することもできます。
属性と ID のマッピング map
マッピング 手順では、プロファイルに書き出す属性および ID フィールドを選択できます。 また、書き出したファイル内のヘッダーを選択して、任意のわかりやすい名前に変更することもできます。詳しくは、「バッチの宛先をアクティベート」UI チュートリアルのマッピング手順を参照してください。
データの正常な書き出しの検証 exported-data
データが正常に書き出されたかどうかを確認するには、Azure Data Lake Storage Gen2 ストレージを確認し、書き出されたファイルに想定されるプロファイル母集団が含まれていることを確認してください。