Azure Data Lake Storage Gen2 接続

概要 overview

このページでは、Azure Data Lake Storage Gen2(ADLS Gen2)データレイクへのライブアウトバウンド接続を作成し、Experience Platform から定期的にデータファイルを書き出す方法を説明します。

API または UI を使用した ADLS Gen2 ストレージへの接続 connect-api-or-ui

サポートされるオーディエンス supported-audiences

この節では、この宛先に書き出すことができるオーディエンスのタイプについて説明します。

オーディエンスオリジン
サポートあり
説明
Segmentation Service
Experience Platform セグメント化サービスを通じて生成されたオーディエンス。
カスタムアップロード
CSV ファイルから Experience Platform に読み込まれたオーディエンス。

書き出しのタイプと頻度 export-type-frequency

宛先の書き出しのタイプと頻度について詳しくは、以下の表を参照してください。

項目
タイプ
メモ
書き出しタイプ
プロファイルベース
宛先のアクティベーションワークフローのプロファイル属性の選択画面で選択したように、該当するスキーマフィールド(例:PPID)と共に、セグメントのすべてのメンバーを書き出しています。
書き出し頻度
バッチ
バッチ宛先では、ファイルが 3 時間、6 時間、8 時間、12 時間、24 時間の単位でダウンストリームプラットフォームに書き出されます。 詳しくは、バッチ(ファイルベース)宛先を参照してください。

データセットを書き出し export-datasets

この宛先では、データセットの書き出しをサポートしています。 データセットの書き出しを設定する方法について詳しくは、次のチュートリアルを参照してください。

書き出されたデータのファイル形式 file-format

オーディエンスデータ を書き出す際、Platform は、指定されたストレージの場所に .csvparquet または .json ファイルを作成します。 ファイルについて詳しくは、Audience Activation チュートリアルの 書き出しでサポートされるファイル形式の節を参照してください。

データセット を書き出す際、Platform は、指定されたストレージの場所に .parquet または .json ファイルを作成します。 ファイルについて詳しくは、データセットの書き出しチュートリアルの データセットの書き出しが成功したことを確認するの節を参照してください。

宛先への接続 connect

IMPORTANT
宛先に接続するには、宛先の表示 および 宛先の管理 アクセス制御権限が必要です。 詳しくは、アクセス制御の概要または製品管理者に問い合わせて、必要な権限を取得してください。

この宛先に接続するには、宛先設定のチュートリアルの手順に従ってください。宛先の設定ワークフローで、以下の 2 つの節でリストされているフィールドに入力します。

宛先に対する認証 authenticate

宛先を認証するには、必須フィールドに入力し、「宛先に接続」を選択します。

  • URL:Azure Data Lake Storage Gen2 のエンドポイント。エンドポイントパターンは abfss://<container>@<accountname>.dfs.core.windows.net です。

  • テナント:アプリケーションを含んだテナント情報。

  • サービスプリンシパル ID:アプリケーションのクライアント ID。

  • サービスプリンシパルキー:アプリケーションのキー。

  • 暗号化キー:必要に応じて、RSA 形式の公開鍵を添付して、書き出したファイルに暗号化を追加できます。 正しい形式の暗号化キーの例については、以下の画像を参照してください。

    UI での正しい形式の PGP キーの例を示す画像

宛先の詳細の入力 destination-details

宛先の詳細を設定するには、以下の必須フィールドとオプションフィールドに入力します。UI のフィールドの横のアスタリスクは、そのフィールドが必須であることを示します。

  • 名前:この宛先に希望する名前を入力します。

  • 説明:オプション。例えば、この宛先を使用しているキャンペーンを指定できます。

  • フォルダーパス:書き出したファイルをホストする宛先フォルダーへのパス。

  • ファイルの種類:書き出したファイルに使用するExperience Platformの形式を選択します。 CSV オプションを選択する場合、 ファイル形式オプションを設定することもできます。

  • 圧縮形式:書き出したファイルにExperience Platformで使用する圧縮タイプを選択します。

  • マニフェストファイルを含める:書き出しに、書き出しの場所や書き出しのサイズなどに関する情報を含んだマニフェスト JSON ファイルを含めたい場合は、このオプションをオンに切り替えます。 マニフェストには、形式 manifest-<<destinationId>>-<<dataflowRunId>>.json を使用して名前を付けます。 サンプル マニフェスト ファイルを表示します。 マニフェストファイルには、次のフィールドが含まれています。

    • flowRunId:書き出されたファイルを生成した データフロー実行
    • scheduledTime: ファイルが書き出された時間(UTC 単位)。
    • exportResults.sinkPath:書き出されたファイルが格納されるストレージの場所のパス。
    • exportResults.name:書き出すファイルの名前。
    • size:書き出されたファイルのサイズ(バイト単位)。

アラートの有効化 enable-alerts

アラートを有効にすると、宛先へのデータフローのステータスに関する通知を受け取ることができます。リストからアラートを選択して、データフローのステータスに関する通知を受け取るよう登録します。アラートについて詳しくは、UI を使用した宛先アラートの購読についてのガイドを参照してください。

宛先接続の詳細の入力を終えたら「次へ」を選択します。

この宛先に対してオーディエンスをアクティブ化 activate

IMPORTANT
  • データをアクティブ化するには、宛先の表示宛先のアクティブ化プロファイルの表示 および セグメントの表示 アクセス制御権限が必要です。 アクセス制御の概要を参照するか、製品管理者に問い合わせて必要な権限を取得してください。

  • ID を書き出すには、ID グラフの表示 アクセス制御権限が必要です。

    宛先に対してオーディエンスをアクティブ化するために、ワークフローでハイライト表示されている ID 名前空間を選択します。 {width="100" modal="regular"}

この宛先に対してオーディエンスをアクティブ化する手順については、 プロファイル書き出しのバッチ宛先に対するオーディエンスデータのアクティブ化を参照してください。

スケジュール設定 scheduling

スケジュール設定 ​手順では、Azure Data Lake Storage Gen2 宛先の書き出しスケジュールを設定し、書き出したファイルの名前を設定することもできます。

属性と ID のマッピング map

マッピング ​手順では、プロファイルに書き出す属性および ID フィールドを選択できます。 また、書き出したファイル内のヘッダーを選択して、任意のわかりやすい名前に変更することもできます。詳しくは、「バッチの宛先をアクティベート」UI チュートリアルのマッピング手順を参照してください。

データの正常な書き出しの検証 exported-data

データが正常に書き出されたかどうかを確認するには、Azure Data Lake Storage Gen2 ストレージを確認し、書き出されたファイルに想定されるプロファイル母集団が含まれていることを確認してください。

recommendation-more-help
7f4d1967-bf93-4dba-9789-bb6b505339d6