(ベータ版)クラウドストレージ宛先へのデータセットの書き出し

重要
  • データセットの書き出し機能は現在ベータ版で、すべてのユーザーが利用できるわけではありません。ドキュメントと機能は変更される場合があります。
  • このベータ版機能では、Real-time Customer Data Platform の製品説明で定義されている第 1 世代データの書き出しをサポートしています。
  • この機能は、Real-Time CDP Prime および Ultimate パッケージを購入したお客様が利用できます。詳しくは、アドビ担当者にお問い合わせください。

この記事では、エクスポートに必要なワークフローについて説明します データセット Adobe Experience Platformから目的のクラウドストレージの場所 ( Amazon S3、SFTP の場所、または Google Cloud Storage Experience PlatformUI を使用。

また、Experience PlatformAPI を使用してデータセットを書き出すこともできます。 詳しくは、 データセット API の書き出しチュートリアル を参照してください。

サポートされる宛先

現在、以下のスクリーンショットでハイライト表示されているクラウドストレージの宛先にデータセットを書き出すことができます。

データセットの書き出しをサポートする宛先

セグメントをアクティブ化するタイミングまたはデータセットを書き出すタイミング

Experience Platform カタログ内の一部のファイルベース宛先では、セグメントのアクティベーションとデータセットの書き出しの両方をサポートしています。

  • データを、オーディエンスの関心または選定別にグループ化されたプロファイルに構造化する場合は、セグメントのアクティブ化を検討してください。
  • また、オーディエンスの関心や選定別にグループ化または構造化されていない未加工のデータセットを書き出そうとしている場合は、データセットの書き出しを検討します。 このデータは、レポート、データサイエンスワークフロー、コンプライアンス要件への適合、その他多くのユースケースに使用できます。

このドキュメントには、データセットの書き出しに必要な情報がすべて含まれています。クラウドストレージ宛先またはメールマーケティング宛先に対してセグメントをアクティブ化する場合は、バッチプロファイル書き出し宛先に対するオーディエンスデータのアクティブ化を参照してください。

前提条件

データセットをクラウドストレージ宛先に書き出すには、正常に宛先に接続されている必要があります。まだ接続していない場合は、宛先カタログに移動し、サポートされている宛先を参照し、使用する宛先を設定します。

必要な権限

データセットを書き出すには、宛先の管理宛先の表示宛先のアクティブ化データセット宛先の管理とアクティブ化​の各アクセス制御権限が必要です。 必要な権限を取得するには、アクセス制御の概要を参照するか、製品管理者に問い合わせてください。

データセットの書き出しに必要な権限があることと、宛先でデータセットの書き出しがサポートされていることを確認するには、宛先カタログを参照します。 宛先に「アクティブ化」または「データセットを書き出し」コントロールがある場合、適切な権限を持っています。

宛先の選択

データセットを書き出すことができる宛先を選択するには、次の手順に従います。

  1. 接続/宛先​に移動し、「カタログ」タブを選択します。

    カタログコントロールがハイライト表示された「宛先カタログ」タブ

  2. データセットを書き出す宛先に対応するカードで、「アクティブ化」または「データセットを書き出し」を選択します。

    「アクティブ化」コントロールがハイライト表示された「宛先カタログ」タブ

  3. データタイプデータセット」を選択し、データセットを書き出す宛先接続を選択して、「次へ」を選択します。

ヒント

データセットを書き出す新しい宛先を設定する場合は、「新しい宛先を設定」を選択して、宛先に接続ワークフローをトリガーします。

「データセット」コントロールがハイライト表示された宛先のアクティベーションワークフロー

  1. データセットを選択​ビューが表示されます。 次の節に進んで、書き出すデータセットを選択します。

データセットの選択

データセット名の左側にあるチェックボックスを使用して、宛先に書き出すデータセットを選択し、「次へ」を選択します。

書き出すデータセットを選択できる「データセットを選択」ステップが表示されているデータセット書き出しワークフロー

データセット書き出しのスケジュール設定

スケジュール設定​ステップでは、データセット書き出しの開始日と書き出しケイデンスを設定できます。

増分ファイルの書き出し」オプションが自動的に選択されます。 これにより、書き出しがトリガーされます。最初のファイルがデータセットの完全なスナップショットになり、それ以降のファイルは前回の書き出し以降のデータセットへの増分追加になります。

重要

最初に書き出された増分ファイルには、データセット内の既存のデータがすべて含まれ、バックフィルとして機能します。

「スケジュール設定」ステップが表示されているデータセット書き出しワークフロー

  1. 頻度」セレクターを使用して、書き出しの頻度を選択します。

    • 毎日:増分ファイルの書き出しを、毎日 1 回、指定した時刻にスケジュールします。
    • 毎時:増分ファイルの書き出しを、3 時間、6 時間、8 時間または 12 時間ごとにスケジュールします。
  2. 時間​セレクターを使用して、ファイルが書き出される時刻を UTC 形式で指定します。

  3. 日付​セレクターを使用して、書き出しが行われる間隔を選択します。なお、この機能のベータ版では、書き出しの終了日を設定できません。 詳しくは、既知の制限事項の節を参照してください。

  4. 次へ」を選択して、スケジュールを保存し、レビュー​ステップに進みます。

メモ

データセット書き出しの場合、ファイル名には事前に設定されたデフォルトの形式が使用され、これを変更することはできません。 書き出されたファイルの詳細と例については、データセットの正常な書き出しの確認の節を参照してください。

レビュー

レビュー」ページには、選択内容の概要が表示されます。「キャンセル」を選択してフローを中断するか、「戻る」を選択して設定を変更する、または「完了」を選択して選択内容を確定し、宛先へのデータセットの書き出しを開始します。

レビューステップを表示するデータセット書き出しワークフロー

データセットの正常な書き出しの確認

データセットを書き出す際、Experience Platform は、指定されたストレージの場所に .json または .parquet ファイルを保存します。指定した書き出しスケジュールに従って、新しいファイルがストレージの場所に格納されます。

Experience Platform は、指定されたストレージの場所にフォルダー構造を作成し、書き出されたデータセットファイルを格納します。 書き出しのたびに、次のパターンに従って新しいフォルダーが作成されます。

folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM

デフォルトのファイル名はランダムに生成され、書き出されたファイルの名前は必ず一意になります。

サンプルデータセットファイル

これらのファイルがストレージの場所に存在すれば、書き出しは成功しています。書き出されたファイルの構造を理解するには、サンプルの .parquet ファイルまたは .json ファイルをダウンロードできます。

宛先からのデータセットの削除

既存のデータフローからデータセットを削除するには、次の手順に従います。

  1. Experience Platform UI にログインし、左側のナビゲーションバーから「宛先」を選択します。上部のヘッダーから「参照」を選択して、既存の宛先データフローを表示します。

    宛先接続が表示され残りの部分がぼかされた宛先参照ビュー

    ヒント

    左上のフィルターアイコン フィルターアイコン を選択して、並べ替えパネルを開きます。並べ替えパネルには、すべての宛先のリストが表示されます。 リストから複数の宛先を選択して、選択した宛先に関連付けられた特定のデータフローを表示できます。

  2. アクティベーションデータ​列から、データセットコントロールを選択して、この書き出しデータフローにマッピングされているすべてのデータセットを表示します。

    アクティベーションデータ列で強調表示されている使用可能なデータセットナビゲーションオプション

  3. 宛先の​アクティベーションデータ​ページが表示されます。 右側のパネルで「データセットを削除」を選択すると、データセット削除の確認ダイアログが表示されます。

    右側のパネルに「データセットの削除」コントロールが表示されているデータセットを削除ダイアログ

  4. 確認ダイアログで、「削除」を選択すると、宛先への書き出しからデータセットが直ちに削除されます。

    データフローからのデータセットの削除を確認するオプションを表示するダイアログ

既知の制限事項

データセット書き出しのベータ版リリースでは、次の制限事項に注意してください。

  • 現在、データセット宛先に対する管理権限とアクティベート権限を含む単一の権限(データセット宛先の管理とアクティベート)が存在します。これらのコントロールは、今後、よりきめ細かい権限に分割される予定です。 データセットの書き出しに必要な権限の完全なリストについては、必要な権限の節を参照してください。
  • 現在、増分ファイルの書き出しのみ可能で、データセット書き出しでは終了日を選択できません。
  • 書き出されるファイルの名前は現在、カスタマイズできません。
  • 宛先に書き出されるデータセットの削除は、現在、UI で禁止されていません。 宛先に書き出されるデータセットは削除しないでください。 データセットを削除する場合は、まず、宛先データフローからデータセットを削除します。
  • データセット書き出しの監視指標は、現在、プロファイル書き出しの数値と混在しているので、実際の書き出し数値を反映していません。

このページ