この記事では、エクスポートに必要なワークフローについて説明します データセット Adobe Experience Platformから目的のクラウドストレージの場所 ( Amazon S3、SFTP の場所、または Google Cloud Storage Experience PlatformUI を使用。
また、Experience PlatformAPI を使用してデータセットを書き出すこともできます。 詳しくは、 データセット API の書き出しチュートリアル を参照してください。
現在、以下のスクリーンショットでハイライト表示されているクラウドストレージの宛先にデータセットを書き出すことができます。
Experience Platform カタログ内の一部のファイルベース宛先では、セグメントのアクティベーションとデータセットの書き出しの両方をサポートしています。
このドキュメントには、データセットの書き出しに必要な情報がすべて含まれています。クラウドストレージ宛先またはメールマーケティング宛先に対してセグメントをアクティブ化する場合は、バッチプロファイル書き出し宛先に対するオーディエンスデータのアクティブ化を参照してください。
データセットをクラウドストレージ宛先に書き出すには、正常に宛先に接続されている必要があります。まだ接続していない場合は、宛先カタログに移動し、サポートされている宛先を参照し、使用する宛先を設定します。
データセットを書き出すには、宛先の管理、宛先の表示、宛先のアクティブ化、データセット宛先の管理とアクティブ化の各アクセス制御権限が必要です。 必要な権限を取得するには、アクセス制御の概要を参照するか、製品管理者に問い合わせてください。
データセットの書き出しに必要な権限があることと、宛先でデータセットの書き出しがサポートされていることを確認するには、宛先カタログを参照します。 宛先に「アクティブ化」または「データセットを書き出し」コントロールがある場合、適切な権限を持っています。
データセットを書き出すことができる宛先を選択するには、次の手順に従います。
接続/宛先に移動し、「カタログ」タブを選択します。
データセットを書き出す宛先に対応するカードで、「アクティブ化」または「データセットを書き出し」を選択します。
「データタイプデータセット」を選択し、データセットを書き出す宛先接続を選択して、「次へ」を選択します。
データセットを書き出す新しい宛先を設定する場合は、「新しい宛先を設定」を選択して、宛先に接続ワークフローをトリガーします。
データセット名の左側にあるチェックボックスを使用して、宛先に書き出すデータセットを選択し、「次へ」を選択します。
スケジュール設定ステップでは、データセット書き出しの開始日と書き出しケイデンスを設定できます。
「増分ファイルの書き出し」オプションが自動的に選択されます。 これにより、書き出しがトリガーされます。最初のファイルがデータセットの完全なスナップショットになり、それ以降のファイルは前回の書き出し以降のデータセットへの増分追加になります。
最初に書き出された増分ファイルには、データセット内の既存のデータがすべて含まれ、バックフィルとして機能します。
「頻度」セレクターを使用して、書き出しの頻度を選択します。
時間セレクターを使用して、ファイルが書き出される時刻を UTC 形式で指定します。
日付セレクターを使用して、書き出しが行われる間隔を選択します。なお、この機能のベータ版では、書き出しの終了日を設定できません。 詳しくは、既知の制限事項の節を参照してください。
「次へ」を選択して、スケジュールを保存し、レビューステップに進みます。
データセット書き出しの場合、ファイル名には事前に設定されたデフォルトの形式が使用され、これを変更することはできません。 書き出されたファイルの詳細と例については、データセットの正常な書き出しの確認の節を参照してください。
「レビュー」ページには、選択内容の概要が表示されます。「キャンセル」を選択してフローを中断するか、「戻る」を選択して設定を変更する、または「完了」を選択して選択内容を確定し、宛先へのデータセットの書き出しを開始します。
データセットを書き出す際、Experience Platform は、指定されたストレージの場所に .json
または .parquet
ファイルを保存します。指定した書き出しスケジュールに従って、新しいファイルがストレージの場所に格納されます。
Experience Platform は、指定されたストレージの場所にフォルダー構造を作成し、書き出されたデータセットファイルを格納します。 書き出しのたびに、次のパターンに従って新しいフォルダーが作成されます。
folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
デフォルトのファイル名はランダムに生成され、書き出されたファイルの名前は必ず一意になります。
これらのファイルがストレージの場所に存在すれば、書き出しは成功しています。書き出されたファイルの構造を理解するには、サンプルの .parquet ファイルまたは .json ファイルをダウンロードできます。
既存のデータフローからデータセットを削除するには、次の手順に従います。
Experience Platform UI にログインし、左側のナビゲーションバーから「宛先」を選択します。上部のヘッダーから「参照」を選択して、既存の宛先データフローを表示します。
左上のフィルターアイコン を選択して、並べ替えパネルを開きます。並べ替えパネルには、すべての宛先のリストが表示されます。 リストから複数の宛先を選択して、選択した宛先に関連付けられた特定のデータフローを表示できます。
アクティベーションデータ列から、データセットコントロールを選択して、この書き出しデータフローにマッピングされているすべてのデータセットを表示します。
宛先のアクティベーションデータページが表示されます。 右側のパネルで「データセットを削除」を選択すると、データセット削除の確認ダイアログが表示されます。
確認ダイアログで、「削除」を選択すると、宛先への書き出しからデータセットが直ちに削除されます。
データセット書き出しのベータ版リリースでは、次の制限事項に注意してください。