检索符合条件的数据集

您可以检索符合条件的数据集列表以供导出,并使用GET /connectionSpecs/{id}/configs API验证您的数据集是否属于该列表。

创建源连接

接下来,您必须使用要导出到云存储目标的数据集的唯一ID 为数据集创建源连接。 您使用POST /sourceConnections API。

向目标进行身份验证(创建基本连接)

您现在必须创建基本连接以使用POST /targetConection API进行身份验证并将凭据安全地存储到您的云存储目标。

提供导出参数

接下来,您必须🔗再使用POST /targetConection API创建一个目标连接,用于存储数据集的导出参数。 这些导出参数包括位置、文件格式、压缩等。

设置数据流

最后,您设置数据流,以确保使用POST /flows API将您的数据集导出到云存储目标。 在此步骤中,您可以使用scheduleParams参数定义导出的计划。

验证数据流

检查数据流是否成功执行,请使用GET /runs API,将数据流ID指定为查询参数。 此数据流ID是您在设置数据流时返回的标识符。

验证数据导出是否成功。 导出数据集时,Experience Platform会在目标中定义的存储位置创建一个或多个.json.parquet文件。 根据您设置的导出计划,希望将新文件存储在您的存储位置。 Experience Platform会在您指定为选定目标的一部分的存储位置中创建文件夹结构,存放导出的文件。 每次导出时都会创建一个新文件夹,其模式为: folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM。 默认文件名是随机生成的,并确保导出的文件名是唯一的。

recommendation-more-help