Azure Data Lake Storage Gen2 接続

概要 overview

このページでは、Azure Data Lake Storage Gen2(ADLS Gen2)データレイクへのライブアウトバウンド接続を作成し、Experience Platform から定期的にデータファイルを書き出す方法を説明します。

に接続 ADLS Gen2 api または UI を介したストレージ connect-api-or-ui

サポートされるオーディエンス supported-audiences

この節では、この宛先に書き出すことができるオーディエンスのタイプについて説明します。

オーディエンスオリジン
サポートあり
説明
Segmentation Service
Experience Platformを通じて生成されたオーディエンス セグメント化サービス.
カスタムアップロード
CSV ファイルから Experience Platform に読み込まれたオーディエンス。

書き出しのタイプと頻度 export-type-frequency

宛先の書き出しのタイプと頻度について詳しくは、以下の表を参照してください。

項目
タイプ
メモ
書き出しタイプ
プロファイルベース
宛先のアクティベーションワークフローのプロファイル属性の選択画面で選択したように、該当するスキーマフィールド(例:PPID)と共に、セグメントのすべてのメンバーを書き出しています。
書き出し頻度
バッチ
バッチ宛先では、ファイルが 3 時間、6 時間、8 時間、12 時間、24 時間の単位でダウンストリームプラットフォームに書き出されます。 詳しくは、バッチ(ファイルベース)宛先を参照してください。

データセットを書き出し export-datasets

この宛先では、データセットの書き出しをサポートしています。 データセットの書き出しを設定する方法について詳しくは、次のチュートリアルを参照してください。

書き出されたデータのファイル形式 file-format

書き出し時 オーディエンスデータ、Platform は .csv, parquet、または .json ファイルは、指定したストレージの場所にあります。 ファイルの詳細については、を参照してください 書き出しでサポートされるファイル形式 Audience Activation チュートリアルの「」の節。

書き出し時 データセット、Platform は .parquet または .json ファイルは、指定したストレージの場所にあります。 ファイルの詳細については、を参照してください データセットの正常な書き出しの確認 データセットの書き出しに関するチュートリアルの「」節。

宛先への接続 connect

IMPORTANT
宛先に接続するには、 宛先の表示 および 宛先の管理 アクセス制御権限. 詳しくは、アクセス制御の概要または製品管理者に問い合わせて、必要な権限を取得してください。

この宛先に接続するには、宛先設定のチュートリアルの手順に従ってください。宛先の設定ワークフローで、以下の 2 つの節でリストされているフィールドに入力します。

宛先に対する認証 authenticate

宛先を認証するには、必須フィールドに入力し、「宛先に接続」を選択します。

  • URL:Azure Data Lake Storage Gen2 のエンドポイント。エンドポイントパターンは abfss://<container>@<accountname>.dfs.core.windows.net です。

  • テナント:アプリケーションを含んだテナント情報。

  • サービスプリンシパル ID:アプリケーションのクライアント ID。

  • サービスプリンシパルキー:アプリケーションのキー。

  • 暗号化キー:必要に応じて、RSA 形式の公開鍵を添付して、書き出したファイルに暗号化を追加できます。 正しい形式の暗号化キーの例については、以下の画像を参照してください。

    UI での正しい形式の PGP キーの例を示す画像

宛先の詳細の入力 destination-details

宛先の詳細を設定するには、以下の必須フィールドとオプションフィールドに入力します。UI のフィールドの横のアスタリスクは、そのフィールドが必須であることを示します。

  • 名前:この宛先に希望する名前を入力します。

  • 説明:オプション。例えば、この宛先を使用しているキャンペーンを指定できます。

  • フォルダーパス:書き出したファイルをホストする宛先フォルダーへのパス。

  • ファイルタイプ:書き出したファイルでExperience Platformが使用するフォーマットを選択します。 を選択した場合 CSV オプションを使用すると、次のこともできます ファイル形式オプションの設定.

  • 圧縮フォーマット:書き出したファイルにExperience Platformで使用する圧縮タイプを選択します。

  • マニフェストファイルを含める:書き出しに、書き出しの場所、書き出しサイズなどに関する情報を含んだマニフェスト JSON ファイルを含める場合は、このオプションをオンに切り替えます。 マニフェストには、形式を使用して名前を付けます manifest-<<destinationId>>-<<dataflowRunId>>.json. を表示 サンプルマニフェストファイル. マニフェストファイルには、次のフィールドが含まれています。

    • flowRunId:です データフローの実行 書き出されたファイルを生成した。
    • scheduledTime:ファイルが書き出された時間(UTC 単位)。
    • exportResults.sinkPath:書き出したファイルを格納するストレージの場所のパス。
    • exportResults.name:書き出すファイルの名前。
    • size:書き出したファイルのサイズ(バイト単位)。

アラートの有効化 enable-alerts

アラートを有効にすると、宛先へのデータフローのステータスに関する通知を受け取ることができます。リストからアラートを選択して、データフローのステータスに関する通知を受け取るよう登録します。アラートについて詳しくは、UI を使用した宛先アラートの購読についてのガイドを参照してください。

宛先接続の詳細の入力を終えたら「次へ」を選択します。

この宛先に対してオーディエンスをアクティブ化 activate

IMPORTANT
  • データをアクティブ化するには、 宛先の表示, 宛先のアクティブ化, プロファイルの表示、および セグメントの表示 アクセス制御権限. アクセス制御の概要を参照するか、製品管理者に問い合わせて必要な権限を取得してください。
  • エクスポートする id、が必要です ID グラフの表示 アクセス制御権限.
    宛先に対してオーディエンスをアクティブ化するために、ワークフローで強調表示されている ID 名前空間を選択します。 {width="100" modal="regular"}

参照: プロファイル書き出しのバッチ宛先に対するオーディエンスデータの有効化 この宛先に対してオーディエンスをアクティブ化する手順については、を参照してください。

スケジュール設定 scheduling

スケジュール設定 ​手順では、Azure Data Lake Storage Gen2 宛先の書き出しスケジュールを設定し、書き出したファイルの名前を設定することもできます。

属性と ID のマッピング map

マッピング ​手順では、プロファイルに書き出す属性および ID フィールドを選択できます。 また、書き出したファイル内のヘッダーを選択して、任意のわかりやすい名前に変更することもできます。詳しくは、「バッチの宛先をアクティベート」UI チュートリアルのマッピング手順を参照してください。

データの正常な書き出しの検証 exported-data

データが正常に書き出されたかどうかを確認するには、Azure Data Lake Storage Gen2 ストレージを確認し、書き出されたファイルに想定されるプロファイル母集団が含まれていることを確認してください。

recommendation-more-help
7f4d1967-bf93-4dba-9789-bb6b505339d6