使用Flow Service API导出数据集
- 已购买Real-Time CDP Prime和Ultimate软件包、Adobe Journey Optimizer或Customer Journey Analytics的客户可以使用此功能。 有关更多信息,请与您的Adobe代表联系。
endTime
日期的选项。 对于在9月版本 之前创建 的所有数据集导出数据流,Adobe还引入了2025年5月1日的默认结束日期。 对于其中任何数据流,您需要手动更新数据流中的结束日期在结束日期之前,否则您的导出将停止在该日期。 使用Experience PlatformUI查看哪些数据流将设置为在5月1日停止。endTime
日期的任何数据流,这些时间将默认为自其创建之日起六个月的结束时间。本文介绍使用Flow Service API将数据集从Adobe Experience Platform导出到首选云存储位置(如Amazon S3、SFTP位置或Google Cloud Storage)所需的工作流。
可用于导出的数据集 datasets-to-export
您可以导出的数据集取决于Experience Platform应用程序(Real-Time CDP、Adobe Journey Optimizer)、层(Prime或Ultimate)以及您购买的任何加载项(例如:Data Distiller)。
请参阅UI教程页面🔗上的表以了解可以导出哪些数据集。
支持的目标 supported-destinations
目前,您可以将数据集导出到屏幕快照中突出显示的云存储目标,如下所列。
快速入门 get-started
本指南要求您对 Adobe Experience Platform 的以下组件有一定了解:
- Experience Platform datasets:成功引入Adobe Experience Platform的所有数据将作为数据集保留在Data Lake中。 数据集是用于数据集合的存储和管理结构,通常是表格,其中包含架构(列)和字段(行)。数据集还包含描述其存储的数据的各个方面的元数据。
- Sandboxes: Experience Platform提供了将单个Platform实例划分为多个单独的虚拟环境的虚拟沙箱,以帮助开发和改进数字体验应用程序。
以下部分提供了要将数据集导出到Platform中的云存储目标必须了解的其他信息。
所需的权限 permissions
要导出数据集,您需要 查看目标、查看数据集 和 管理和激活数据集目标 访问控制权限。 阅读访问控制概述或联系您的产品管理员以获取所需的权限。
要确保您具有导出数据集的必要权限并且目标支持导出数据集,请浏览目标目录。 如果目标具有 激活 或 导出数据集 控件,则您具有相应的权限。
正在读取示例 API 调用 reading-sample-api-calls
本教程提供了示例API调用来演示如何格式化请求。 这些包括路径、必需的标头和格式正确的请求负载。还提供了在 API 响应中返回的示例 JSON。有关示例API调用文档中使用的约定的信息,请参阅Experience Platform疑难解答指南中有关如何读取示例API调用的部分。
收集必需标题和可选标题的值 gather-values-headers
要调用Platform API,您必须先完成Experience Platform身份验证教程。 完成身份验证教程会提供所有 Experience Platform API 调用中每个所需标头的值,如下所示:
- 授权:持有人
{ACCESS_TOKEN}
- x-api-key:
{API_KEY}
- x-gw-ims-org-id:
{ORG_ID}
Experience Platform中的资源可以隔离到特定的虚拟沙箱。 在对Platform API的请求中,您可以指定将在其中执行操作的沙盒的名称和ID。 这些是可选参数。
- x-sandbox-name:
{SANDBOX_NAME}
所有包含有效负载(POST、PUT、PATCH)的请求都需要额外的媒体类型标头:
- 内容类型:
application/json
API参考文档 api-reference-documentation
您可以在本教程中找到所有API操作的随附参考文档。 请参阅Adobe Developer网站🔗上的Flow Service - Destinations API文档。 我们建议您并行使用此教程和API参考文档。
术语表 glossary
有关将在此API教程中遇到的术语的说明,请阅读API参考文档的术语表部分。
收集所需目标的连接规格和流量规格 gather-connection-spec-flow-spec
在开始导出数据集的工作流之前,请确定要将数据集导出到的目标的连接规范和流量规范ID。 请参考下表。
4fce964d-3f37-408f-9778-e597338a21ee
269ba276-16fc-47db-92b0-c1049a3c131f
6d6b59bf-fb58-4107-9064-4d246c0e5bb2
95bd8965-fc8a-4119-b9c3-944c2c2df6d2
be2c3209-53bc-47e7-ab25-145db8b873e1
17be2013-2549-41ce-96e7-a70363bec293
10440537-2a7b-4583-ac39-ed38d4b848e8
cd2fc47e-e838-4f38-a581-8fff2f99b63a
c5d93acb-ea8b-4b14-8f53-02138444ae99
585c15c4-6cbf-4126-8f87-e26bff78b657
36965a81-b1c6-401b-99f8-22508f1e6a26
354d6aad-4754-46e4-a576-1b384561c440
您需要这些ID来构造各种Flow Service实体。 您还需要引用Connection Spec本身的部分来设置某些实体,以便可以从Flow Service APIs检索Connection Spec。 请参阅下面的示例,以了解如何检索表中所有目标的连接规范:
请求
accordion | ||
---|---|---|
检索Amazon S3的connection spec | ||
|
响应
accordion | ||
---|---|---|
Amazon S3 — 连接规范 | ||
|
请求
accordion | ||
---|---|---|
检索Azure Blob Storage的connection spec | ||
|
响应
accordion | ||
---|---|---|
Azure Blob Storage — Connection spec | ||
|
请求
accordion | ||
---|---|---|
检索Azure Data Lake Gen 2(ADLS Gen2的connection spec) | ||
|
响应
accordion | ||
---|---|---|
Azure Data Lake Gen 2(ADLS Gen2) — Connection spec | ||
|
请求
accordion | ||
---|---|---|
检索Data Landing Zone(DLZ)的connection spec | ||
|
响应
accordion | ||
---|---|---|
Data Landing Zone(DLZ) — Connection spec | ||
|
请求
accordion | ||
---|---|---|
检索Google Cloud Storage的connection spec | ||
|
响应
accordion | ||
---|---|---|
Google Cloud Storage — Connection spec | ||
|
请求
accordion | ||
---|---|---|
检索connection spec以获取SFTP | ||
|
响应
accordion | ||
---|---|---|
SFTP - Connection spec | ||
|
请按照以下步骤设置传送到云存储目标的数据集数据流。 对于某些步骤,不同云存储目标之间的请求和响应会有所不同。 在这些情况下,使用页面上的选项卡可检索特定于您要连接并导出数据集的目标的请求和响应。 请确保为您配置的目标使用正确的connection spec和flow spec。
检索数据集列表 retrieve-list-of-available-datasets
要检索符合激活条件的数据集列表,首先要对以下端点进行API调用。
请求
code language-shell |
---|
|
请注意,要检索符合条件的数据集,请求URL中使用的connection spec ID必须是数据湖源连接规范ID 23598e46-f560-407b-88d5-ea6207e49db0
,并且必须指定两个查询参数outputField=datasets
和outputType=activationDatasets
。 所有其他查询参数是目录服务API支持的标准参数。
响应
code language-json |
---|
|
成功的响应包含符合激活条件的数据集列表。 在下一步中构建源连接时,可以使用这些数据集。
有关每个返回的数据集的各种响应参数的信息,请参阅数据集API开发人员文档。
创建源连接 create-source-connection
在检索要导出的数据集列表后,您可以使用这些数据集ID创建源连接。
请求
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
code language-shell line-numbers data-start-1 data-line-offset-4 h-12 h-16 |
---|
|
响应
code language-json |
---|
|
成功的响应返回新创建的源连接的ID (id
)和etag
。 记下源连接ID,因为稍后创建数据流时会需要它。
另请记住:
- 在此步骤中创建的源连接需要链接到数据流,才能将其数据集激活到目标。 有关如何将源连接链接到数据流的信息,请参阅创建数据流部分。
- 源连接的数据集ID在创建后无法修改。 如果需要从源连接添加或删除数据集,则必须创建新的源连接,并将新源连接的ID链接到数据流。
创建(target)基本连接 create-base-connection
基本连接会将凭据安全地存储到您的目标。 根据目标类型,对该目标进行身份验证所需的凭据可能有所不同。 要查找这些身份验证参数,请首先按照收集连接规格和流量规格一节中所述检索所需目标的connection spec,然后查看响应的authSpec
。 请引用下面的选项卡,以查看所有受支持目标的authSpec
属性。
accordion | ||
---|---|---|
Amazon S3 - Connection spec显示auth spec | ||
请注意下面connection spec示例中带有内联注释的高亮显示行,这些注释提供了有关在connection spec中何处查找身份验证参数的更多信息。
|
accordion | ||
---|---|---|
Azure Blob Storage - Connection spec显示auth spec | ||
请注意下面connection spec示例中带有内联注释的高亮显示行,这些注释提供了有关在connection spec中何处查找身份验证参数的更多信息。
|
accordion | ||
---|---|---|
Azure Data Lake Gen 2(ADLS Gen2) - Connection spec显示auth spec | ||
请注意下面connection spec示例中带有内联注释的高亮显示行,这些注释提供了有关在connection spec中何处查找身份验证参数的更多信息。
|
accordion | |||||
---|---|---|---|---|---|
Data Landing Zone(DLZ) - Connection spec显示auth spec | |||||
|
accordion | ||
---|---|---|
Google Cloud Storage - Connection spec显示auth spec | ||
请注意下面connection spec示例中带有内联注释的高亮显示行,这些注释提供了有关在connection spec中何处查找身份验证参数的更多信息。
|
accordion | |||||
---|---|---|---|---|---|
SFTP - Connection spec显示auth spec | |||||
请注意下面connection spec示例中带有内联注释的高亮显示行,这些注释提供了有关在connection spec中何处查找身份验证参数的更多信息。
|
使用身份验证规范中指定的属性(即响应中的authSpec
),您可以使用特定于每个目标类型的所需凭据创建基本连接,如以下示例所示:
请求
accordion | |||||
---|---|---|---|---|---|
Amazon S3 — 基本连接请求 | |||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
|
响应
accordion | ||
---|---|---|
Amazon S3基本连接响应 | ||
|
请求
accordion | |||||
---|---|---|---|---|---|
Azure Blob Storage — 基本连接请求 | |||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
|
响应
accordion | ||
---|---|---|
Azure Blob Storage — 基本连接响应 | ||
|
请求
accordion | |||||
---|---|---|---|---|---|
Azure Data Lake Gen 2(ADLS Gen2) — 基本连接请求 | |||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
|
响应
accordion | ||
---|---|---|
Azure Data Lake Gen 2(ADLS Gen2) — 基本连接响应 | ||
|
请求
accordion | |||||
---|---|---|---|---|---|
Data Landing Zone(DLZ) — 基本连接请求 | |||||
|
响应
accordion | ||
---|---|---|
Data Landing Zone — 基本连接响应 | ||
|
请求
accordion | |||||
---|---|---|---|---|---|
Google Cloud Storage — 基本连接请求 | |||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
|
响应
accordion | ||
---|---|---|
Google Cloud Storage — 基本连接响应 | ||
|
请求
accordion | |||||
---|---|---|---|---|---|
包含密码的SFTP — 基本连接请求 | |||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
|
accordion | |||||
---|---|---|---|---|---|
使用SSH密钥的SFTP — 基本连接请求 | |||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
|
响应
accordion | ||
---|---|---|
SFTP — 基本连接响应 | ||
|
记下响应中的连接ID。 创建目标连接时,此ID将在下一步中是必需的。
创建目标连接 create-target-connection
接下来,您需要创建一个目标连接,用于存储数据集的导出参数。 导出参数包括位置、文件格式、压缩和其他详细信息。 请参阅目标的连接规范中提供的targetSpec
属性,以了解每个目标类型支持的属性。 请引用下面的选项卡,以查看所有受支持目标的targetSpec
属性。
accordion | ||
---|---|---|
Amazon S3 - Connection spec显示目标连接参数 | ||
请注意下面connection spec示例中带有内联注释的高亮显示行,这些行提供了有关在连接规范中何处查找target spec参数的更多信息。 您还可以在以下示例中看到以下目标参数是 不适用于 数据集导出目标。
|
accordion | ||
---|---|---|
Azure Blob Storage - Connection spec显示目标连接参数 | ||
请注意下面connection spec示例中带有内联注释的高亮显示行,这些行提供了有关在连接规范中何处查找target spec参数的更多信息。 您还可以在以下示例中看到以下目标参数是 不适用于 数据集导出目标。
|
accordion | ||
---|---|---|
Azure Data Lake Gen 2(ADLS Gen2) - Connection spec显示目标连接参数 | ||
请注意下面connection spec示例中带有内联注释的高亮显示行,这些行提供了有关在连接规范中何处查找target spec参数的更多信息。 您还可以在以下示例中看到以下目标参数是 不适用于 数据集导出目标。
|
accordion | ||
---|---|---|
Data Landing Zone(DLZ) - Connection spec显示目标连接参数 | ||
请注意下面connection spec示例中带有内联注释的高亮显示行,这些行提供了有关在连接规范中何处查找target spec参数的更多信息。 您还可以在以下示例中看到以下目标参数是 不适用于 数据集导出目标。
|
accordion | ||
---|---|---|
Google Cloud Storage - Connection spec显示目标连接参数 | ||
请注意下面connection spec示例中带有内联注释的高亮显示行,这些行提供了有关在连接规范中何处查找target spec参数的更多信息。 您还可以在以下示例中看到以下目标参数是 不适用于 数据集导出目标。
|
accordion | ||
---|---|---|
SFTP - Connection spec显示目标连接参数 | ||
请注意下面connection spec示例中带有内联注释的高亮显示行,这些行提供了有关在连接规范中何处查找target spec参数的更多信息。 您还可以在以下示例中看到以下目标参数是 不适用于 数据集导出目标。
|
通过使用上述规范,您可以构建特定于所需云存储目标的目标连接请求,如下面的选项卡所示。
请求
accordion | |||||
---|---|---|---|---|---|
Amazon S3 - Target连接请求 | |||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
|
响应
accordion | ||
---|---|---|
Target连接 — 响应 | ||
|
请求
accordion | |||||
---|---|---|---|---|---|
Azure Blob Storage - Target连接请求 | |||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
|
响应
accordion | ||
---|---|---|
Target连接 — 响应 | ||
|
请求
accordion | |||||
---|---|---|---|---|---|
Azure Blob Storage - Target连接请求 | |||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
|
响应
accordion | ||
---|---|---|
Target连接 — 响应 | ||
|
请求
accordion | |||||
---|---|---|---|---|---|
Data Landing Zone - Target连接请求 | |||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
|
响应
accordion | ||
---|---|---|
Target连接 — 响应 | ||
|
请求
accordion | |||||
---|---|---|---|---|---|
Google Cloud Storage - Target连接请求 | |||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
|
响应
accordion | ||
---|---|---|
Target连接 — 响应 | ||
|
请求
accordion | |||||
---|---|---|---|---|---|
SFTP - Target连接请求 | |||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
|
响应
accordion | ||
---|---|---|
Target连接 — 响应 | ||
|
记下响应中的Target连接ID。 创建数据流以导出数据集时,在下一步中需要此ID。
创建数据流 create-dataflow
目标配置的最后一步是设置数据流。 数据流将以前创建的实体连接在一起,还提供了用于配置数据集导出计划的选项。 要创建数据流,请根据所需的云存储目标使用以下有效负载,并替换之前步骤中的实体ID。
请求
accordion | ||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
创建到Amazon S3目标的数据集数据流 — 请求 | ||||||||||||||||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
下表提供了
|
响应
accordion | ||
---|---|---|
创建数据流 — 响应 | ||
|
请求
accordion | ||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
创建到Azure Blob Storage目标的数据集数据流 — 请求 | ||||||||||||||||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
下表提供了
|
响应
accordion | ||
---|---|---|
创建数据流 — 响应 | ||
|
请求
accordion | ||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
创建到Azure Data Lake Gen 2(ADLS Gen2)目标的数据集数据流 — 请求 | ||||||||||||||||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
下表提供了
|
响应
accordion | ||
---|---|---|
创建数据流 — 响应 | ||
|
请求
accordion | ||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
创建到Data Landing Zone目标的数据集数据流 — 请求 | ||||||||||||||||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
下表提供了
|
响应
accordion | ||
---|---|---|
创建数据流 — 响应 | ||
|
请求
accordion | ||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
创建到Google Cloud Storage目标的数据集数据流 — 请求 | ||||||||||||||||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
下表提供了
|
响应
accordion | ||
---|---|---|
创建数据流 — 响应 | ||
|
请求
accordion | ||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
创建到SFTP目标的数据集数据流 — 请求 | ||||||||||||||||||
请注意请求示例中带有内联注释的高亮显示行,这些行提供了更多信息。 将请求复制粘贴到您选择的终端时,删除请求中的内联注释。
下表提供了
|
响应
accordion | ||
---|---|---|
创建数据流 — 响应 | ||
|
记下响应中的数据流ID。 检索数据流运行时在下一步中需要此ID来验证成功的日期集导出。
获取数据流运行 get-dataflow-runs
要检查数据流的执行,请使用数据流运行API:
请求
在检索数据流运行的请求中,在创建数据流时,将您在上一步中获取的数据流ID添加为查询参数。
code language-shell |
---|
|
响应
code language-json |
---|
|
您可以在API参考文档中找到有关数据流运行API🔗返回的各种参数的信息。
验证是否成功导出数据集 verify
导出数据集时,Experience Platform会在您提供的存储位置中创建.json
或.parquet
文件。 根据您在创建数据流时提供的导出计划,期望将新文件存储在您的存储位置。
Experience Platform会在您指定的存储位置创建一个文件夹结构,存放导出的数据集文件。 每次导出时都会创建一个新文件夹,其模式如下所示:
folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
默认文件名是随机生成的,并确保导出的文件名是唯一的。
示例数据集文件 sample-files
这些文件在存储位置中的存在是成功导出的确认。 要了解导出文件的结构方式,您可以下载示例.parquet文件或.json文件。
压缩的数据集文件 compressed-dataset-files
在创建目标连接的步骤中,您可以选择导出的要压缩的数据集文件。
请注意两种文件类型在压缩后的文件格式差异:
- 导出压缩的JSON文件时,导出的文件格式为
json.gz
- 导出压缩的parquet文件时,导出的文件格式为
gz.parquet
- JSON文件只能在压缩模式下导出。
API错误处理 api-error-handling
本教程中的API端点遵循常规Experience PlatformAPI错误消息原则。 有关解释错误响应的详细信息,请参阅Platform疑难解答指南中的API状态代码和请求标头错误。
常见问题 faq
查看有关数据集导出的常见问题列表。
后续步骤 next-steps
通过学习本教程,您已成功将Platform连接到其中一个首选批量云存储目标,并将数据流设置到相应的目标以导出数据集。 有关更多详细信息,请参阅以下页面,例如如何使用流服务API编辑现有数据流: