この記事では、エクスポートに必要なワークフローについて説明します。 データセット Adobe Experience Platformから目的のクラウドストレージの場所 ( Amazon S3、SFTP の場所、または Google Cloud Storage Experience PlatformUI を使用。
また、Experience PlatformAPI を使用してデータセットを書き出すこともできます。 詳しくは、 データセット API の書き出しチュートリアル を参照してください。
書き出すデータセットは、Experience Platformアプリケーション (Real-Time CDP、Adobe Journey Optimizer)、層(Prime または Ultimate)、および購入したアドオン ( 例:Data Distiller) に応じて異なります。
以下の表で、アプリケーション、製品層、購入したアドオンに応じて、書き出すデータセットのタイプを説明します。
アプリケーション/アドオン | 層 | 書き出しに使用できるデータセット |
---|---|---|
Real-Time CDP | Prime | ソース、Web SDK、Mobile SDK、Analytics Data Connector およびAudience Managerを使用してデータを取得または収集した後、Experience PlatformUI で作成されたプロファイルおよびエクスペリエンスイベントデータセット。 |
Ultimate |
|
|
Adobe Journey Optimizer | Prime | 詳しくは、 Adobe Journey Optimizer ドキュメント。 |
Ultimate | 詳しくは、 Adobe Journey Optimizer ドキュメント。 | |
Data Distiller | Data Distiller (アドオン) | クエリサービスを使用して作成された派生データセット。 |
このページで説明するワークフロー、データセットのエクスポート機能の利点、推奨される使用例については、以下のビデオをご覧ください。
現在、以下のスクリーンショットでハイライト表示されているクラウドストレージの宛先にデータセットを書き出すことができます。
Experience Platformカタログ内の一部のファイルベースの宛先は、オーディエンスのアクティベーションとデータセットの書き出しの両方をサポートしています。
このドキュメントには、データセットの書き出しに必要な情報がすべて含まれています。をアクティブ化する場合 audiences クラウドストレージまたは電子メールマーケティングの宛先については、 プロファイルの一括書き出し先に対するオーディエンスデータのアクティブ化.
データセットをクラウドストレージ宛先に書き出すには、正常に宛先に接続されている必要があります。まだ接続していない場合は、宛先カタログに移動し、サポートされている宛先を参照し、使用する宛先を設定します。
データセットを書き出すには、 宛先の表示, データセットを表示、および データセットの宛先の管理とアクティブ化 アクセス制御権限. 必要な権限を取得するには、アクセス制御の概要を参照するか、製品管理者に問い合わせてください。
データセットの書き出しに必要な権限があることと、宛先でデータセットの書き出しがサポートされていることを確認するには、宛先カタログを参照します。 宛先に「アクティブ化」または「データセットを書き出し」コントロールがある場合、適切な権限を持っています。
データセットを書き出すことができる宛先を選択するには、次の手順に従います。
接続/宛先に移動し、「カタログ」タブを選択します。
データセットを書き出す宛先に対応するカードで、「アクティブ化」または「データセットを書き出し」を選択します。
「データタイプデータセット」を選択し、データセットを書き出す宛先接続を選択して、「次へ」を選択します。
データセットを書き出す新しい宛先を設定する場合は、「新しい宛先を設定」を選択して、宛先に接続ワークフローをトリガーします。
データセット名の左側にあるチェックボックスを使用して、宛先に書き出すデータセットを選択し、「次へ」を選択します。
Adobe Analytics の スケジュール 手順では、データセットのエクスポートの開始日とエクスポートケイデンスを設定できます。
「増分ファイルの書き出し」オプションが自動的に選択されます。 これにより、書き出しがトリガーされます。最初のファイルがデータセットの完全なスナップショットになり、それ以降のファイルは前回の書き出し以降のデータセットへの増分追加になります。
最初に書き出された増分ファイルには、データセット内の既存のデータがすべて含まれ、バックフィルとして機能します。
「頻度」セレクターを使用して、書き出しの頻度を選択します。
時間セレクターを使用して、ファイルが書き出される時刻を UTC 形式で指定します。
日付セレクターを使用して、書き出しが行われる間隔を選択します。現在、エクスポートの終了日を設定することはできません。 詳しくは、既知の制限事項の節を参照してください。
「次へ」を選択して、スケジュールを保存し、レビューステップに進みます。
データセット書き出しの場合、ファイル名には事前に設定されたデフォルトの形式が使用され、これを変更することはできません。 書き出されたファイルの詳細と例については、データセットの正常な書き出しの確認の節を参照してください。
「レビュー」ページには、選択内容の概要が表示されます。「キャンセル」を選択してフローを中断するか、「戻る」を選択して設定を変更する、または「完了」を選択して選択内容を確定し、宛先へのデータセットの書き出しを開始します。
データセットを書き出す際、Experience Platform は、指定されたストレージの場所に .json
または .parquet
ファイルを保存します。指定した書き出しスケジュールに従って、新しいファイルがストレージの場所に格納されます。
Experience Platform は、指定されたストレージの場所にフォルダー構造を作成し、書き出されたデータセットファイルを格納します。 書き出しのたびに、次のパターンに従って新しいフォルダーが作成されます。
folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
デフォルトのファイル名はランダムに生成され、書き出されたファイルの名前は必ず一意になります。
これらのファイルがストレージの場所に存在すれば、書き出しは成功しています。書き出されたファイルの構造を理解するには、サンプルの .parquet ファイルまたは .json ファイルをダウンロードできます。
Adobe Analytics の 宛先ワークフローに接続次に示すように、書き出したデータセットファイルを選択して圧縮できます。
圧縮時のファイル形式の違いに注意してください。
json.gz
gz.parquet
既存のデータフローからデータセットを削除するには、次の手順に従います。
Experience Platform UI にログインし、左側のナビゲーションバーから「宛先」を選択します。上部のヘッダーから「参照」を選択して、既存の宛先データフローを表示します。
左上のフィルターアイコン を選択して、並べ替えパネルを開きます。並べ替えパネルには、すべての宛先のリストが表示されます。 リストから複数の宛先を選択して、選択した宛先に関連付けられた特定のデータフローを表示できます。
アクティベーションデータ列から、データセットコントロールを選択して、この書き出しデータフローにマッピングされているすべてのデータセットを表示します。
宛先のアクティベーションデータページが表示されます。 右側のパネルで「データセットを削除」を選択すると、データセット削除の確認ダイアログが表示されます。
確認ダイアログで、「削除」を選択すると、宛先への書き出しからデータセットが直ちに削除されます。
製品の説明に関するドキュメントを参照して、各Experience Platformアプリケーションに対して 1 年に書き出す権利があるデータの量を把握します。 例えば、Real-Time CDPの製品説明を表示できます ここ.
様々なアプリケーションのデータエクスポートの使用権限は、追加的なものではありません。 例えば、Real-Time CDP Ultimate とAdobe Journey Optimizer Ultimate を購入した場合、製品の説明に従って、プロファイルの書き出しに関する権利付与は、2 つの権利のうち大きいほうが大きくなります。 ボリュームの使用権限は、ライセンスが必要なプロファイルの総数を取得し、Real-Time CDP Prime の場合は 500 KB、Real-Time CDP Ultimate の場合は 700 KB を乗じて、使用できるデータ量を決定します。
一方、Data Distillerなどのアドオンを購入した場合、使用権限を持つデータ書き出し制限は、製品層とアドオンの合計を表します。
ライセンスダッシュボードで、契約上の制限に対するプロファイルの書き出しを表示および追跡できます。
データセットエクスポートの一般リリースでは、次の制限事項に注意してください。