クラウドストレージの宛先へのデータセットの書き出し

AVAILABILITY
  • この機能は、Real-Time CDP Prime または Ultimate パッケージ、Adobe Journey OptimizerまたはCustomer Journey Analyticsを購入したお客様が利用できます。 詳しくは、Adobe担当者にお問い合わせください。

この記事では、書き出しに必要なワークフローについて説明します データセット Adobe Experience Platformから目的のクラウドストレージの場所(例:) Amazon S3、SFTP の場所または Google Cloud Storage Experience PlatformUI を使用する。

Experience PlatformAPI を使用してデータセットを書き出すこともできます。 を読み取る データセット書き出し API のチュートリアル を参照してください。

書き出すことができるデータセット datasets-to-export

書き出すことができるデータセットは、Experience Platformアプリケーション(Real-Time CDP、Adobe Journey Optimizer)、層(Prime または Ultimate)、購入したアドオン(例:Data Distiller)によって異なります。

アプリケーション、製品層、購入したアドオンに応じて、書き出すことができるデータセットのタイプを次の表から理解します。

アプリケーション / アドオン
書き出すことができるデータセット
Real-Time CDP
Prime
ソース、Web SDK、Mobile SDK、Analytics Data Connector およびAudience Managerからデータを取り込んだり収集した後、Experience PlatformUI で作成されたプロファイルおよびエクスペリエンスイベントデータセット。
Ultimate
Adobe Journey Optimizer
Prime
を参照してください。 Adobe Journey Optimizer ドキュメント。
Ultimate
を参照してください。 Adobe Journey Optimizer ドキュメント。
Customer Journey Analytics
すべて

ソース、Web SDK、Mobile SDK、Analytics Data Connector およびAudience Managerからデータを取り込んだり収集した後、Experience PlatformUI で作成されたプロファイルおよびエクスペリエンスイベントデータセット。

提供状況に関する注意事項: データセットをクラウドに書き出す機能は、リリースの限定的テスト段階にあり、お使いの環境ではまだ使用できない場合があります。 機能が一般に利用できるようになったら、このメモは削除されます。Customer Journey Analyticsリリースプロセスについて詳しくは、を参照してください。 Customer Journey Analytics機能リリース.

Data Distiller
Data Distiller(アドオン)
クエリサービスを通じて作成された派生データセット。

ビデオチュートリアル video-tutorial

このページで説明されているワークフローのエンドツーエンドの説明、データセットの書き出し機能を使用するメリット、推奨されるユースケースについては、以下のビデオをご覧ください。

サポートされる宛先 supported-destinations

現在、スクリーンショットでハイライト表示され、以下に示されているクラウドストレージの宛先にデータセットを書き出すことができます。

データセット書き出しをサポートする宛先を示した宛先カタログページ。

オーディエンスをアクティブ化するか、データセットを書き出すタイミング when-to-activate-audiences-or-activate-datasets

Experience Platformカタログ内の一部のファイルベース宛先では、オーディエンスのアクティベーションとデータセットの書き出しの両方をサポートしています。

  • データを、オーディエンスの関心または選定別にグループ化されたプロファイルに構造化する場合は、オーディエンスのアクティブ化を検討してください。
  • また、オーディエンスの関心や選定別にグループ化または構造化されていない未加工のデータセットを書き出そうとしている場合は、データセットの書き出しを検討します。 このデータは、レポート、データサイエンスワークフロー、その他の多くのユースケースに使用できます。 例えば、管理者、データエンジニアまたはアナリストは、Experience Platformからデータをエクスポートしてデータウェアハウスと同期したり、BI 分析ツールや外部 Cloud ML ツールで使用したり、システムに保存して長期的なストレージのニーズに対応したりできます。

このドキュメントには、データセットの書き出しに必要な情報がすべて含まれています。をアクティベートする場合 オーディエンス クラウドストレージまたはメールマーケティングの宛先には、次を参照してください: プロファイル書き出しのバッチ宛先に対するオーディエンスデータの有効化.

前提条件 prerequisites

データセットをクラウドストレージ宛先に書き出すには、正常に宛先に接続されている必要があります。まだ接続していない場合は、宛先カタログに移動し、サポートされている宛先を参照し、使用する宛先を設定します。

必要な権限 permissions

データセットを書き出すには、 宛先の表示, データセットの表示、および データセット宛先の管理とアクティブ化 アクセス制御権限. 必要な権限を取得するには、アクセス制御の概要を参照するか、製品管理者に問い合わせてください。

データセットの書き出しに必要な権限があることと、宛先でデータセットの書き出しがサポートされていることを確認するには、宛先カタログを参照します。 宛先に「アクティブ化」または「データセットを書き出し」コントロールがある場合、適切な権限を持っています。

宛先の選択 select-destination

データセットを書き出すことができる宛先を選択するには、次の手順に従います。

  1. 接続/宛先 ​に移動し、「カタログ」タブを選択します。

    カタログコントロールがハイライト表示された「宛先カタログ」タブ

  2. データセットを書き出す宛先に対応するカードで、「アクティブ化」または「データセットを書き出し」を選択します。

    「アクティブ化」コントロールがハイライト表示された「宛先カタログ」タブ

  3. データタイプデータセット」を選択し、データセットを書き出す宛先接続を選択して、「次へ」を選択します。

TIP
データセットを書き出す新しい宛先を設定する場合は、「新しい宛先を設定」を選択して、宛先に接続ワークフローをトリガーします。

「データセット」コントロールがハイライト表示された宛先のアクティベーションワークフロー

  1. データセットを選択 ​ビューが表示されます。 次の節に進んで、書き出すデータセットを選択します。

データセットの選択 select-datasets

データセット名の左側にあるチェックボックスを使用して、宛先に書き出すデータセットを選択し、「次へ」を選択します。

書き出すデータセットを選択できる「データセットを選択」ステップが表示されているデータセット書き出しワークフロー

データセット書き出しのスケジュール設定 scheduling

が含まれる スケジュール 手順では、データセット書き出しの開始日と書き出しケイデンスを設定できます。

増分ファイルの書き出し」オプションが自動的に選択されます。 これにより、データセットの完全なスナップショットを表す 1 つまたは複数のファイルの書き出しがトリガーされます。 以降のファイルは、前回の書き出し以降のデータセットへの増分追加です。

IMPORTANT
最初の増分ファイル書き出しには、データセット内の既存のデータがすべて含まれ、バックフィルとして機能します。 書き出しには、1 つまたは複数のファイルを含めることができます。

「スケジュール設定」ステップが表示されているデータセット書き出しワークフロー

  1. 頻度」セレクターを使用して、書き出しの頻度を選択します。

    • 毎日:増分ファイルの書き出しを、毎日 1 回、指定した時刻にスケジュールします。
    • 毎時:増分ファイルの書き出しを、3 時間、6 時間、8 時間または 12 時間ごとにスケジュールします。
  2. 時間 ​セレクターを使用して、ファイルが書き出される時刻を UTC 形式で指定します。

  3. 日付 ​セレクターを使用して、書き出しが行われる間隔を選択します。現在、書き出しの終了日は設定できません。 詳しくは、既知の制限事項の節を参照してください。

  4. 次へ」を選択して、スケジュールを保存し、レビュー ​ステップに進みます。

NOTE
データセット書き出しの場合、ファイル名には事前に設定されたデフォルトの形式が使用され、これを変更することはできません。 書き出されたファイルの詳細と例については、データセットの正常な書き出しの確認の節を参照してください。

レビュー review

レビュー」ページには、選択内容の概要が表示されます。「キャンセル」を選択してフローを中断するか、「戻る」を選択して設定を変更する、または「完了」を選択して選択内容を確定し、宛先へのデータセットの書き出しを開始します。

レビューステップを表示するデータセット書き出しワークフロー

データセットの正常な書き出しの確認 verify

データセットを書き出す際に、Experience Platformが 1 つ以上のデータセットを作成する .json または .parquet 指定したストレージの場所にあるファイル。 指定した書き出しスケジュールに従って、新しいファイルがストレージの場所に格納されます。

Experience Platform は、指定されたストレージの場所にフォルダー構造を作成し、書き出されたデータセットファイルを格納します。 書き出しのたびに、次のパターンに従って新しいフォルダーが作成されます。

folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM

デフォルトのファイル名はランダムに生成され、書き出されたファイルの名前は必ず一意になります。

サンプルデータセットファイル sample-files

これらのファイルがストレージの場所に存在すれば、書き出しは成功しています。書き出されたファイルの構造を理解するには、サンプルの .parquet ファイルまたは .json ファイルをダウンロードできます。

圧縮されたデータセットファイル compressed-dataset-files

が含まれる 宛先ワークフローへの接続次に示すように、書き出し済みの圧縮するデータセットファイルを選択できます。

データセットを書き出す宛先に接続する際のファイルタイプと圧縮選択。

2 つのファイルタイプを圧縮した場合、ファイル形式に違いがあることに注意してください。

  • 圧縮 JSON ファイルを書き出す場合、書き出されるファイル形式はです。 json.gz
  • 圧縮 Parquet ファイルをエクスポートする場合、エクスポートされるファイル形式はです。 gz.parquet

宛先からのデータセットの削除 remove-dataset

既存のデータフローからデータセットを削除するには、次の手順に従います。

  1. Experience Platform UI にログインし、左側のナビゲーションバーから「宛先」を選択します。上部のヘッダーから「参照」を選択して、既存の宛先データフローを表示します。

    宛先接続が表示され残りの部分がぼかされた宛先参照ビュー

    note tip
    TIP
    左上のフィルターアイコン フィルターアイコン を選択して、並べ替えパネルを開きます。並べ替えパネルには、すべての宛先のリストが表示されます。 リストから複数の宛先を選択して、選択した宛先に関連付けられた特定のデータフローを表示できます。
  2. アクティベーションデータ ​列から、データセットコントロールを選択して、この書き出しデータフローにマッピングされているすべてのデータセットを表示します。

    アクティベーションデータ列で強調表示されている使用可能なデータセットナビゲーションオプション

  3. [ベータ版]{class="badge informative"} この アクティベーションデータ 宛先のページが表示されます。 データセットリストの左側にあるチェックボックスを使用して、削除するデータセットを選択し、選択します データセットを削除 右側のパネルで「データセットを削除」確認ダイアログをトリガーします。

    note note
    NOTE
    この機能はベータ版で、一部のお客様のみご利用いただけます。 この機能へのアクセス権をリクエストするには、Adobe担当者にお問い合わせください。

    右側のパネルに「データセットの削除」コントロールが表示されているデータセットを削除ダイアログ

  4. 確認ダイアログで、「削除」を選択すると、宛先への書き出しからデータセットが直ちに削除されます。

    データフローからのデータセットの削除を確認するオプションを表示するダイアログ

データセット書き出し権限 licensing-entitlement

Experience Platformの説明文書を参照して、1 年にエクスポートできるデータの量を確認してください。 例えば、Real-Time CDPの商品の説明を表示できます こちら.

様々なアプリケーションのデータ書き出し権限は追加的ではないことに注意してください。 例えば、Real-Time CDP Ultimate とAdobe Journey Optimizer Ultimate を購入した場合、製品の説明に従って、プロファイルの書き出し権限は 2 つの権限のうち大きい方になります。 ボリューム使用権限は、ライセンス済みプロファイルの合計数を取得し、Real-Time CDP Prime の場合は 500 KB、Real-Time CDP Ultimate の場合は 700 KB を乗じて、使用資格のあるデータのボリュームを判断することで計算されます。

一方、Data Distillerなどのアドオンを購入した場合、データ書き出し制限は、製品層とアドオンの合計を表します。

ライセンスダッシュボードで、契約上の制限に照らしてプロファイルの書き出しを表示および追跡できます。

既知の制限事項 known-limitations

データセット書き出しの一般リリースについては、次の制限事項に注意してください。

  • 現在、増分ファイルの書き出しのみ可能で、データセット書き出しでは終了日を選択できません。
  • 書き出されるファイルの名前は現在、カスタマイズできません。
  • API を使用して作成したデータセットは、現在、書き出しには使用できません。
  • 宛先に書き出されるデータセットの削除は、現在、UI で禁止されていません。 宛先に書き出されるデータセットは削除しないでください。 データセットを削除する場合は、まず、宛先データフローからデータセットを削除します。
  • データセット書き出しの監視指標は、現在、プロファイル書き出しの数値と混在しているので、実際の書き出し数値を反映していません。
  • タイムスタンプが 365 日より古いデータは、データセットの書き出しから除外されます。 詳しくは、 スケジュールされたデータセット書き出しのガードレール
recommendation-more-help
7f4d1967-bf93-4dba-9789-bb6b505339d6