设置循环导入工作流 setting-up-a-recurring-import

Last update: Fri Jul 19 2024 00:00:00 GMT+0000 (Coordinated Universal Time)

主题：
数据管理

如果需要定期导入具有相同结构的文件，则使用工作流模板是一种最佳实践。

此示例说明如何预先设置一个可重复使用的工作流，用于导入来自Adobe Campaign数据库中CRM的用户档案。有关每个活动的所有可能设置的详细信息，请参阅此部分。

从 Resources > Templates > Workflow templates 创建新的工作流模板。
添加以下活动：
- Data loading (file)：定义包含要导入的数据的文件的预期结构。
- Enrichment：使用数据库数据协调导入的数据。
- Split：创建过滤器以根据是否可以协调记录而采用不同方式处理记录。
- Deduplication：在将数据插入数据库之前，从传入文件中删除重复数据。
- Update data：使用导入的用户档案更新数据库。

配置 Data Loading (file) 活动：

通过上传样例文件来定义预期的结构。样例文件应仅包含几行，但应包含导入所需的所有列。检查并编辑文件格式，确保正确设置了每列的类型：文本、日期、整数等。例如：

code language-none
`lastname;firstname;birthdate;email;crmID Smith;Hayden;23/05/1989;hayden.smith@mailtest.com;123456`

在 Name of the file to load 部分中，选择 Upload a file from the local machine 并将字段留空。每次从此模板创建新工作流时，只要该文件与定义的结构相对应，您就可以在此处指定所需的文件。

您可以使用任何选项，但必须相应地修改模板。例如，如果选择 Specified in the transition，您可以先添加 File Transfer 活动，然后检索要从FTP/SFTP服务器导入的文件。通过S3或SFTP连接，您还可以将区段数据导入Adobe实时客户数据平台的Adobe Campaign。有关详细信息，请参阅此文档。

配置 Enrichment 活动。在此上下文中，此活动的目的是标识传入数据。
- 在 Enrichment 选项卡中，选择 Add data 并定义导入数据与收件人定向维度之间的链接。在此示例中，CRM ID 自定义字段用于创建连接条件。只要允许标识唯一记录，就可以使用所需的字段或字段组合。
- 在 Reconciliation 选项卡中，将 Identify the document from the working data 选项保留为未选中。
将 Split 活动配置为在一个过渡中检索已协调的收件人，以及在第二个过渡中无法协调但具有足够数据的收件人。

然后，可以使用包含已协调收件人的过渡来更新数据库。如果文件中具有最小信息集，则可以使用具有未知收件人的过渡在数据库中创建新收件人条目。

无法协调且数据不足的收件人将在补充叫客过渡中选择，并可以在单独文件中导出或直接忽略。
- 在活动的 General 选项卡中，选择 Use the additional data only 作为筛选设置，并确保自动将 Targeting dimension 设置为 Enrichment。
  
  选中 Generate complement 选项，以便能够查看数据库中是否不能插入任何记录。如果需要，可以对补充数据执行进一步处理：文件导出、列表更新等。
- 在 Subsets 选项卡的第一个子集中，为集客群体添加筛选条件，以仅选择收件人主键不等于0的记录。这样，便在该子集中选择与来自数据库的收件人协调的文件中的数据。
- 添加第二个子集，用于选择具有足够数据可插入数据库中的未协调记录。例如：电子邮件地址、名字和姓氏。
  
  子集按其创建顺序进行处理，这意味着在处理第二个子集时，数据库中已存在的所有记录都已在第一个子集中被选择。
- 在前两个子集中未选择的所有记录都在 Complement 中选择。
配置位于先前配置的 Split 活动的第一个叫客过渡之后的 Update data 活动。
- 选择 Update 作为 Operation type，因为集客过渡仅包含数据库中已存在的收件人。
- 在 Record identification 部分中，选择 Using reconciliation keys 并定义定向维度与在 Enrichment 中创建的链接之间的键。在此示例中，使用了 CRM ID 自定义字段。
- 在 Fields to update 部分中，指示收件人维度中要使用文件中对应列的值更新的字段。如果文件列的名称与收件人维字段的名称相同或几乎相同，则可以使用魔棒按钮自动匹配不同的字段。
配置位于包含未协调收件人的过渡之后的 Deduplication 活动：
- 选择 Edit configuration 并将定向维度设置为从工作流的 Enrichment 活动生成的临时架构。
- 在本例中，电子邮件字段用于查找独特的用户档案。您可以使用任何确信已填充的字段以及唯一组合的一部分。
- 在 Deduplication method 屏幕中，选择 Advanced parameters 并选中 Disable automatic filtering of 0 ID records 选项，以确保不排除主键等于0（应当为此过渡的所有记录）的记录。
配置位于之前配置的 Deduplication 活动之后的 Update data 活动。
- 选择 Insert 作为 Operation type，因为集客过渡仅包含数据库中不存在的收件人。
- 在 Record identification 部分中，选择 Directly using the targeting dimension 并选择 Recipients 维度。
- 在 Fields to update 部分中，指示收件人维度中要使用文件中对应列的值更新的字段。如果文件列的名称与收件人维字段的名称相同或几乎相同，则可以使用魔棒按钮自动匹配不同的字段。
在 Split 活动的第三个过渡之后，如果要跟踪数据库中未插入的数据，请添加 Data extraction (file) 活动和 File transfer 活动。配置这些活动以导出所需的列，并在FTP或SFTP服务器上传输文件，以便检索。
添加 End 活动并保存工作流模板。