Azure Data Lake Storage Gen2 接続
概要 overview
このページでは、Azure Data Lake Storage Gen2(ADLS Gen2)データレイクへのライブアウトバウンド接続を作成し、Experience Platform から定期的にデータファイルを書き出す方法を説明します。
API または UI を使用した ADLS Gen2 ストレージへの接続 connect-api-or-ui
- Platform ユーザーインターフェイスを使用して ADLS Gen2 ストレージの場所に接続するには、以下の 宛先への接続および この宛先に対するオーディエンスのアクティブ化の節を参照してください。
- ADLS Gen2 ストレージの場所にプログラムで接続するには、Flow Service API チュートリアルを使用した、ファイルベースの宛先に対するオーディエンスのアクティブ化を参照してください。
サポートされるオーディエンス supported-audiences
この節では、この宛先に書き出すことができるオーディエンスのタイプについて説明します。
書き出しのタイプと頻度 export-type-frequency
宛先の書き出しのタイプと頻度について詳しくは、以下の表を参照してください。
データセットを書き出し export-datasets
この宛先では、データセットの書き出しをサポートしています。 データセットの書き出しを設定する方法について詳しくは、次のチュートリアルを参照してください。
書き出されたデータのファイル形式 file-format
オーディエンスデータ を書き出す際、Platform は、指定されたストレージの場所に .csv
、parquet
または .json
ファイルを作成します。 ファイルについて詳しくは、Audience Activation チュートリアルの 書き出しでサポートされるファイル形式の節を参照してください。
データセット を書き出す際、Platform は、指定されたストレージの場所に .parquet
または .json
ファイルを作成します。 ファイルについて詳しくは、データセットの書き出しチュートリアルの データセットの書き出しが成功したことを確認するの節を参照してください。
宛先への接続 connect
この宛先に接続するには、宛先設定のチュートリアルの手順に従ってください。宛先の設定ワークフローで、以下の 2 つの節でリストされているフィールドに入力します。
宛先に対する認証 authenticate
宛先を認証するには、必須フィールドに入力し、「宛先に接続」を選択します。
-
URL:Azure Data Lake Storage Gen2 のエンドポイント。エンドポイントパターンは
abfss://<container>@<accountname>.dfs.core.windows.net
です。 -
テナント:アプリケーションを含んだテナント情報。
-
サービスプリンシパル ID:アプリケーションのクライアント ID。
-
サービスプリンシパルキー:アプリケーションのキー。
-
暗号化キー:必要に応じて、RSA 形式の公開鍵を添付して、書き出したファイルに暗号化を追加できます。 正しい形式の暗号化キーの例については、以下の画像を参照してください。
宛先の詳細の入力 destination-details
宛先の詳細を設定するには、以下の必須フィールドとオプションフィールドに入力します。UI のフィールドの横のアスタリスクは、そのフィールドが必須であることを示します。
-
名前:この宛先に希望する名前を入力します。
-
説明:オプション。例えば、この宛先を使用しているキャンペーンを指定できます。
-
フォルダーパス:書き出したファイルをホストする宛先フォルダーへのパス。
-
ファイルの種類:書き出したファイルに使用するExperience Platformの形式を選択します。 CSV オプションを選択する場合、 ファイル形式オプションを設定することもできます。
-
圧縮形式:書き出したファイルにExperience Platformで使用する圧縮タイプを選択します。
-
マニフェストファイルを含める:書き出しに、書き出しの場所や書き出しのサイズなどに関する情報を含んだマニフェスト JSON ファイルを含めたい場合は、このオプションをオンに切り替えます。 マニフェストには、形式
manifest-<<destinationId>>-<<dataflowRunId>>.json
を使用して名前を付けます。 サンプル マニフェスト ファイルを表示します。 マニフェストファイルには、次のフィールドが含まれています。flowRunId
:書き出されたファイルを生成した データフロー実行。scheduledTime
: ファイルが書き出された時間(UTC 単位)。exportResults.sinkPath
:書き出されたファイルが格納されるストレージの場所のパス。exportResults.name
:書き出すファイルの名前。size
:書き出されたファイルのサイズ(バイト単位)。
アラートの有効化 enable-alerts
アラートを有効にすると、宛先へのデータフローのステータスに関する通知を受け取ることができます。リストからアラートを選択して、データフローのステータスに関する通知を受け取るよう登録します。アラートについて詳しくは、UI を使用した宛先アラートの購読についてのガイドを参照してください。
宛先接続の詳細の入力を終えたら「次へ」を選択します。
この宛先に対してオーディエンスをアクティブ化 activate
この宛先に対してオーディエンスをアクティブ化する手順については、 プロファイル書き出しのバッチ宛先に対するオーディエンスデータのアクティブ化を参照してください。
スケジュール設定 scheduling
スケジュール設定 手順では、Azure Data Lake Storage Gen2 宛先の書き出しスケジュールを設定し、書き出したファイルの名前を設定することもできます。
属性と ID のマッピング map
マッピング 手順では、プロファイルに書き出す属性および ID フィールドを選択できます。 また、書き出したファイル内のヘッダーを選択して、任意のわかりやすい名前に変更することもできます。詳しくは、「バッチの宛先をアクティベート」UI チュートリアルのマッピング手順を参照してください。
データの正常な書き出しの検証 exported-data
データが正常に書き出されたかどうかを確認するには、Azure Data Lake Storage Gen2 ストレージを確認し、書き出されたファイルに想定されるプロファイル母集団が含まれていることを確認してください。