クラウドストレージの宛先へのデータセットの書き出し
- この機能は、Real-Time CDP Prime、Ultimate パッケージ、Adobe Journey OptimizerまたはCustomer Journey Analyticsを購入したお客様が利用できます。 詳しくは、Adobe担当者にお問い合わせください。
この記事では、エクスポートに必要なワークフローについて説明します。 データセット Adobe Experience Platformから目的のクラウドストレージの場所 ( Amazon S3、SFTP の場所、または Google Cloud Storage Experience PlatformUI を使用。
また、Experience PlatformAPI を使用してデータセットを書き出すこともできます。 詳しくは、 データセット API の書き出しチュートリアル を参照してください。
書き出しに使用できるデータセット datasets-to-export
書き出すデータセットは、Experience Platformアプリケーション (Real-Time CDP、Adobe Journey Optimizer)、層(Prime または Ultimate)、および購入したアドオン ( 例:Data Distiller) に応じて異なります。
以下の表で、アプリケーション、製品層、購入したアドオンに応じて、書き出すデータセットのタイプを説明します。
- ソース、Web SDK、Mobile SDK、Analytics Data Connector およびAudience Managerを使用してデータを取得または収集した後、Experience PlatformUI で作成されたプロファイルおよびエクスペリエンスイベントデータセット。
- システム生成プロファイルスナップショットデータセット.
ソース、Web SDK、Mobile SDK、Analytics Data Connector およびAudience Managerを使用してデータを取得または収集した後、Experience PlatformUI で作成されたプロファイルおよびエクスペリエンスイベントデータセット。
利用可否に関する注意: データセットをクラウドに書き出す機能は、リリースのテスト段階に限定されており、お使いの環境ではまだ使用できない場合があります。 機能が一般に利用できるようになったら、このメモは削除されます。Customer Journey Analyticsのリリース手順については、 Customer Journey Analytics機能リリース.
ビデオチュートリアル video-tutorial
このページで説明するワークフロー、データセットのエクスポート機能の利点、推奨される使用例については、以下のビデオをご覧ください。
サポートされる宛先 supported-destinations
現在、以下のスクリーンショットでハイライト表示されているクラウドストレージの宛先にデータセットを書き出すことができます。
オーディエンスをアクティブ化する場合、またはデータセットを書き出す場合 when-to-activate-audiences-or-activate-datasets
Experience Platformカタログ内の一部のファイルベースの宛先は、オーディエンスのアクティベーションとデータセットの書き出しの両方をサポートしています。
- オーディエンスの関心または資格別にデータをプロファイルに構造化する場合は、オーディエンスのアクティブ化を検討します。
- また、オーディエンスの関心や選定別にグループ化または構造化されていない未加工のデータセットを書き出そうとしている場合は、データセットの書き出しを検討します。 このデータは、レポート、データサイエンスワークフロー、その他多くの使用例に使用できます。 例えば、Experience Platform、データエンジニア、アナリストは、管理者からデータを書き出して、Data Warehouse と同期したり、BI 分析ツール、外部クラウド ML ツールで使用したり、長期的なストレージニーズに対応したシステムに保存したりできます。
このドキュメントには、データセットの書き出しに必要な情報がすべて含まれています。をアクティブ化する場合 audiences クラウドストレージまたは電子メールマーケティングの宛先については、 プロファイルの一括書き出し先に対するオーディエンスデータのアクティブ化.
前提条件 prerequisites
データセットをクラウドストレージ宛先に書き出すには、正常に宛先に接続されている必要があります。まだ接続していない場合は、宛先カタログに移動し、サポートされている宛先を参照し、使用する宛先を設定します。
必要な権限 permissions
データセットを書き出すには、 宛先の表示, データセットを表示、および データセットの宛先の管理とアクティブ化 アクセス制御権限. 必要な権限を取得するには、アクセス制御の概要を参照するか、製品管理者に問い合わせてください。
データセットの書き出しに必要な権限があることと、宛先でデータセットの書き出しがサポートされていることを確認するには、宛先カタログを参照します。 宛先に「アクティブ化」または「データセットを書き出し」コントロールがある場合、適切な権限を持っています。
宛先の選択 select-destination
データセットを書き出すことができる宛先を選択するには、次の手順に従います。
-
接続/宛先 に移動し、「カタログ」タブを選択します。
-
データセットを書き出す宛先に対応するカードで、「アクティブ化」または「データセットを書き出し」を選択します。
-
「データタイプデータセット」を選択し、データセットを書き出す宛先接続を選択して、「次へ」を選択します。
- データセットを選択 ビューが表示されます。 次の節に進んで、書き出すデータセットを選択します。
データセットの選択 select-datasets
データセット名の左側にあるチェックボックスを使用して、宛先に書き出すデータセットを選択し、「次へ」を選択します。
データセット書き出しのスケジュール設定 scheduling
Adobe Analytics の スケジュール 手順では、データセットのエクスポートの開始日とエクスポートケイデンスを設定できます。
「増分ファイルの書き出し」オプションが自動的に選択されます。 このトリガーでは、データセットの完全なスナップショットを表す 1 つ以上のファイルの書き出しが行われます。 以降のファイルは、前回のエクスポート以降の増分でデータセットに追加されます。
-
「頻度」セレクターを使用して、書き出しの頻度を選択します。
- 毎日:増分ファイルの書き出しを、毎日 1 回、指定した時刻にスケジュールします。
- 毎時:増分ファイルの書き出しを、3 時間、6 時間、8 時間または 12 時間ごとにスケジュールします。
-
時間 セレクターを使用して、ファイルが書き出される時刻を UTC 形式で指定します。
-
日付 セレクターを使用して、書き出しが行われる間隔を選択します。現在、エクスポートの終了日を設定することはできません。 詳しくは、既知の制限事項の節を参照してください。
-
「次へ」を選択して、スケジュールを保存し、レビュー ステップに進みます。
レビュー review
「レビュー」ページには、選択内容の概要が表示されます。「キャンセル」を選択してフローを中断するか、「戻る」を選択して設定を変更する、または「完了」を選択して選択内容を確定し、宛先へのデータセットの書き出しを開始します。
データセットの正常な書き出しの確認 verify
データセットを書き出す際、Experience Platformは 1 つ以上の .json
または .parquet
指定したストレージの場所にあるファイル。 指定した書き出しスケジュールに従って、新しいファイルがストレージの場所に保存されることを想定します。
Experience Platform は、指定されたストレージの場所にフォルダー構造を作成し、書き出されたデータセットファイルを格納します。 書き出しのたびに、次のパターンに従って新しいフォルダーが作成されます。
folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
デフォルトのファイル名はランダムに生成され、書き出されたファイルの名前は必ず一意になります。
サンプルデータセットファイル sample-files
これらのファイルがストレージの場所に存在すれば、書き出しは成功しています。書き出されたファイルの構造を理解するには、サンプルの .parquet ファイルまたは .json ファイルをダウンロードできます。
圧縮データセットファイル compressed-dataset-files
Adobe Analytics の 宛先ワークフローに接続次に示すように、書き出したデータセットファイルを選択して圧縮できます。
圧縮時のファイル形式の違いに注意してください。
- 圧縮 JSON ファイルを書き出す場合、書き出されるファイル形式は次のようになります。
json.gz
- 圧縮 Parquet ファイルを書き出す場合、書き出されるファイル形式は次のようになります。
gz.parquet
宛先からのデータセットの削除 remove-dataset
既存のデータフローからデータセットを削除するには、次の手順に従います。
-
Experience Platform UI にログインし、左側のナビゲーションバーから「宛先」を選択します。上部のヘッダーから「参照」を選択して、既存の宛先データフローを表示します。
note tip TIP 左上のフィルターアイコン を選択して、並べ替えパネルを開きます。並べ替えパネルには、すべての宛先のリストが表示されます。 リストから複数の宛先を選択して、選択した宛先に関連付けられた特定のデータフローを表示できます。 -
アクティベーションデータ 列から、データセットコントロールを選択して、この書き出しデータフローにマッピングされているすべてのデータセットを表示します。
-
宛先の アクティベーションデータ ページが表示されます。 削除するデータセットを選択し、「 」を選択します。 データセットを削除 右側のレールで、データセット削除の確認ダイアログをトリガーにします。
-
確認ダイアログで、「削除」を選択すると、宛先への書き出しからデータセットが直ちに削除されます。
データセット書き出しの権利 licensing-entitlement
製品の説明に関するドキュメントを参照して、各Experience Platformアプリケーションに対して 1 年に書き出す権利があるデータの量を把握します。 例えば、Real-Time CDPの製品説明を表示できます ここ.
様々なアプリケーションのデータエクスポートの使用権限は、追加的なものではありません。 例えば、Real-Time CDP Ultimate とAdobe Journey Optimizer Ultimate を購入した場合、製品の説明に従って、プロファイルの書き出しに関する権利付与は、2 つの権利のうち大きいほうが大きくなります。 ボリュームの使用権限は、ライセンスが必要なプロファイルの総数を取得し、Real-Time CDP Prime の場合は 500 KB、Real-Time CDP Ultimate の場合は 700 KB を乗じて、使用できるデータ量を決定します。
一方、Data Distillerなどのアドオンを購入した場合、使用権限を持つデータ書き出し制限は、製品層とアドオンの合計を表します。
ライセンスダッシュボードで、契約上の制限に対するプロファイルの書き出しを表示および追跡できます。
既知の制限事項 known-limitations
データセットエクスポートの一般リリースでは、次の制限事項に注意してください。
- 現在、増分ファイルの書き出しのみ可能で、データセット書き出しでは終了日を選択できません。
- 書き出されるファイルの名前は現在、カスタマイズできません。
- API で作成されたデータセットは、現在、書き出しに使用できません。
- 宛先に書き出されるデータセットの削除は、現在、UI で禁止されていません。 宛先に書き出されるデータセットは削除しないでください。 データセットを削除する場合は、まず、宛先データフローからデータセットを削除します。
- データセット書き出しの監視指標は、現在、プロファイル書き出しの数値と混在しているので、実際の書き出し数値を反映していません。
- タイムスタンプが 365 日より古いデータは、データセットエクスポートから除外されます。 詳しくは、 スケジュールされたデータセットエクスポートのガードレール