クラウドストレージの宛先へのデータセットの書き出し
- この機能は、Real-Time CDP Prime または Ultimate パッケージ、Adobe Journey OptimizerまたはCustomer Journey Analyticsを購入したお客様が利用できます。 詳しくは、Adobe担当者にお問い合わせください。
この記事では、書き出しに必要なワークフローについて説明します データセット Adobe Experience Platformから目的のクラウドストレージの場所(例:) Amazon S3、SFTP の場所または Google Cloud Storage Experience PlatformUI を使用する。
Experience PlatformAPI を使用してデータセットを書き出すこともできます。 を読み取る データセット書き出し API のチュートリアル を参照してください。
書き出すことができるデータセット datasets-to-export
書き出すことができるデータセットは、Experience Platformアプリケーション(Real-Time CDP、Adobe Journey Optimizer)、層(Prime または Ultimate)、購入したアドオン(例:Data Distiller)によって異なります。
アプリケーション、製品層、購入したアドオンに応じて、書き出すことができるデータセットのタイプを次の表から理解します。
- ソース、Web SDK、Mobile SDK、Analytics Data Connector およびAudience Managerからデータを取り込んだり収集した後、Experience PlatformUI で作成されたプロファイルおよびエクスペリエンスイベントデータセット。
- システム生成プロファイルスナップショットデータセット.
ソース、Web SDK、Mobile SDK、Analytics Data Connector およびAudience Managerからデータを取り込んだり収集した後、Experience PlatformUI で作成されたプロファイルおよびエクスペリエンスイベントデータセット。
提供状況に関する注意事項: データセットをクラウドに書き出す機能は、リリースの限定的テスト段階にあり、お使いの環境ではまだ使用できない場合があります。 機能が一般に利用できるようになったら、このメモは削除されます。Customer Journey Analyticsリリースプロセスについて詳しくは、を参照してください。 Customer Journey Analytics機能リリース.
ビデオチュートリアル video-tutorial
このページで説明されているワークフローのエンドツーエンドの説明、データセットの書き出し機能を使用するメリット、推奨されるユースケースについては、以下のビデオをご覧ください。
サポートされる宛先 supported-destinations
現在、スクリーンショットでハイライト表示され、以下に示されているクラウドストレージの宛先にデータセットを書き出すことができます。
オーディエンスをアクティブ化するか、データセットを書き出すタイミング when-to-activate-audiences-or-activate-datasets
Experience Platformカタログ内の一部のファイルベース宛先では、オーディエンスのアクティベーションとデータセットの書き出しの両方をサポートしています。
- データを、オーディエンスの関心または選定別にグループ化されたプロファイルに構造化する場合は、オーディエンスのアクティブ化を検討してください。
- また、オーディエンスの関心や選定別にグループ化または構造化されていない未加工のデータセットを書き出そうとしている場合は、データセットの書き出しを検討します。 このデータは、レポート、データサイエンスワークフロー、その他の多くのユースケースに使用できます。 例えば、管理者、データエンジニアまたはアナリストは、Experience Platformからデータをエクスポートしてデータウェアハウスと同期したり、BI 分析ツールや外部 Cloud ML ツールで使用したり、システムに保存して長期的なストレージのニーズに対応したりできます。
このドキュメントには、データセットの書き出しに必要な情報がすべて含まれています。をアクティベートする場合 オーディエンス クラウドストレージまたはメールマーケティングの宛先には、次を参照してください: プロファイル書き出しのバッチ宛先に対するオーディエンスデータの有効化.
前提条件 prerequisites
データセットをクラウドストレージ宛先に書き出すには、正常に宛先に接続されている必要があります。まだ接続していない場合は、宛先カタログに移動し、サポートされている宛先を参照し、使用する宛先を設定します。
必要な権限 permissions
データセットを書き出すには、 宛先の表示, データセットの表示、および データセット宛先の管理とアクティブ化 アクセス制御権限. 必要な権限を取得するには、アクセス制御の概要を参照するか、製品管理者に問い合わせてください。
データセットの書き出しに必要な権限があることと、宛先でデータセットの書き出しがサポートされていることを確認するには、宛先カタログを参照します。 宛先に「アクティブ化」または「データセットを書き出し」コントロールがある場合、適切な権限を持っています。
宛先の選択 select-destination
データセットを書き出すことができる宛先を選択するには、次の手順に従います。
-
接続/宛先 に移動し、「カタログ」タブを選択します。
-
データセットを書き出す宛先に対応するカードで、「アクティブ化」または「データセットを書き出し」を選択します。
-
「データタイプデータセット」を選択し、データセットを書き出す宛先接続を選択して、「次へ」を選択します。
- データセットを選択 ビューが表示されます。 次の節に進んで、書き出すデータセットを選択します。
データセットの選択 select-datasets
データセット名の左側にあるチェックボックスを使用して、宛先に書き出すデータセットを選択し、「次へ」を選択します。
データセット書き出しのスケジュール設定 scheduling
が含まれる スケジュール 手順では、データセット書き出しの開始日と書き出しケイデンスを設定できます。
「増分ファイルの書き出し」オプションが自動的に選択されます。 これにより、データセットの完全なスナップショットを表す 1 つまたは複数のファイルの書き出しがトリガーされます。 以降のファイルは、前回の書き出し以降のデータセットへの増分追加です。
-
「頻度」セレクターを使用して、書き出しの頻度を選択します。
- 毎日:増分ファイルの書き出しを、毎日 1 回、指定した時刻にスケジュールします。
- 毎時:増分ファイルの書き出しを、3 時間、6 時間、8 時間または 12 時間ごとにスケジュールします。
-
時間 セレクターを使用して、ファイルが書き出される時刻を UTC 形式で指定します。
-
日付 セレクターを使用して、書き出しが行われる間隔を選択します。現在、書き出しの終了日は設定できません。 詳しくは、既知の制限事項の節を参照してください。
-
「次へ」を選択して、スケジュールを保存し、レビュー ステップに進みます。
レビュー review
「レビュー」ページには、選択内容の概要が表示されます。「キャンセル」を選択してフローを中断するか、「戻る」を選択して設定を変更する、または「完了」を選択して選択内容を確定し、宛先へのデータセットの書き出しを開始します。
データセットの正常な書き出しの確認 verify
データセットを書き出す際に、Experience Platformが 1 つ以上のデータセットを作成する .json
または .parquet
指定したストレージの場所にあるファイル。 指定した書き出しスケジュールに従って、新しいファイルがストレージの場所に格納されます。
Experience Platform は、指定されたストレージの場所にフォルダー構造を作成し、書き出されたデータセットファイルを格納します。 書き出しのたびに、次のパターンに従って新しいフォルダーが作成されます。
folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
デフォルトのファイル名はランダムに生成され、書き出されたファイルの名前は必ず一意になります。
サンプルデータセットファイル sample-files
これらのファイルがストレージの場所に存在すれば、書き出しは成功しています。書き出されたファイルの構造を理解するには、サンプルの .parquet ファイルまたは .json ファイルをダウンロードできます。
圧縮されたデータセットファイル compressed-dataset-files
が含まれる 宛先ワークフローへの接続次に示すように、書き出し済みの圧縮するデータセットファイルを選択できます。
2 つのファイルタイプを圧縮した場合、ファイル形式に違いがあることに注意してください。
- 圧縮 JSON ファイルを書き出す場合、書き出されるファイル形式はです。
json.gz
- 圧縮 Parquet ファイルをエクスポートする場合、エクスポートされるファイル形式はです。
gz.parquet
宛先からのデータセットの削除 remove-dataset
既存のデータフローからデータセットを削除するには、次の手順に従います。
-
Experience Platform UI にログインし、左側のナビゲーションバーから「宛先」を選択します。上部のヘッダーから「参照」を選択して、既存の宛先データフローを表示します。
note tip TIP 左上のフィルターアイコン -
アクティベーションデータ 列から、データセットコントロールを選択して、この書き出しデータフローにマッピングされているすべてのデータセットを表示します。
-
[ベータ版]{class="badge informative"} この アクティベーションデータ 宛先のページが表示されます。 データセットリストの左側にあるチェックボックスを使用して、削除するデータセットを選択し、選択します データセットを削除 右側のパネルで「データセットを削除」確認ダイアログをトリガーします。
note note NOTE この機能はベータ版で、一部のお客様のみご利用いただけます。 この機能へのアクセス権をリクエストするには、Adobe担当者にお問い合わせください。 -
確認ダイアログで、「削除」を選択すると、宛先への書き出しからデータセットが直ちに削除されます。
データセット書き出し権限 licensing-entitlement
Experience Platformの説明文書を参照して、1 年にエクスポートできるデータの量を確認してください。 例えば、Real-Time CDPの商品の説明を表示できます こちら.
様々なアプリケーションのデータ書き出し権限は追加的ではないことに注意してください。 例えば、Real-Time CDP Ultimate とAdobe Journey Optimizer Ultimate を購入した場合、製品の説明に従って、プロファイルの書き出し権限は 2 つの権限のうち大きい方になります。 ボリューム使用権限は、ライセンス済みプロファイルの合計数を取得し、Real-Time CDP Prime の場合は 500 KB、Real-Time CDP Ultimate の場合は 700 KB を乗じて、使用資格のあるデータのボリュームを判断することで計算されます。
一方、Data Distillerなどのアドオンを購入した場合、データ書き出し制限は、製品層とアドオンの合計を表します。
ライセンスダッシュボードで、契約上の制限に照らしてプロファイルの書き出しを表示および追跡できます。
既知の制限事項 known-limitations
データセット書き出しの一般リリースについては、次の制限事項に注意してください。
- 現在、増分ファイルの書き出しのみ可能で、データセット書き出しでは終了日を選択できません。
- 書き出されるファイルの名前は現在、カスタマイズできません。
- API を使用して作成したデータセットは、現在、書き出しには使用できません。
- 宛先に書き出されるデータセットの削除は、現在、UI で禁止されていません。 宛先に書き出されるデータセットは削除しないでください。 データセットを削除する場合は、まず、宛先データフローからデータセットを削除します。
- データセット書き出しの監視指標は、現在、プロファイル書き出しの数値と混在しているので、実際の書き出し数値を反映していません。
- タイムスタンプが 365 日より古いデータは、データセットの書き出しから除外されます。 詳しくは、 スケジュールされたデータセット書き出しのガードレール