设置循环导入工作流 setting-up-a-recurring-import

如果需要定期导入具有相同结构的文件,则使用工作流模板是一种最佳实践。

此示例说明如何预先设置一个可重复使用的工作流,用于导入来自Adobe Campaign数据库中CRM的用户档案。 有关每个活动的所有可能设置的详细信息,请参阅此部分

  1. 从​ Resources > Templates > Workflow templates ​创建新的工作流模板。

  2. 添加以下活动:

    • Data loading (file):定义包含要导入的数据的文件的预期结构。
    • Enrichment:使用数据库数据协调导入的数据。
    • Split:创建过滤器以根据是否可以协调记录而采用不同方式处理记录。
    • Deduplication:在将数据插入数据库之前,从传入文件中删除重复数据。
    • Update data:使用导入的用户档案更新数据库。

  3. 配置​ Data Loading (file) ​活动:

    • 通过上传样例文件来定义预期的结构。 样例文件应仅包含几行,但应包含导入所需的所有列。 检查并编辑文件格式,确保正确设置了每列的类型:文本、日期、整数等。 例如:

      code language-none
      lastname;firstname;birthdate;email;crmID
      Smith;Hayden;23/05/1989;hayden.smith@mailtest.com;123456
      
    • 在​ Name of the file to load ​部分中,选择​ Upload a file from the local machine ​并将字段留空。 每次从此模板创建新工作流时,只要该文件与定义的结构相对应,您就可以在此处指定所需的文件。

      您可以使用任何选项,但必须相应地修改模板。 例如,如果选择​ Specified in the transition,您可以先添加​ File Transfer ​活动,然后检索要从FTP/SFTP服务器导入的文件。 通过S3或SFTP连接,您还可以将区段数据导入Adobe实时客户数据平台的Adobe Campaign。 有关详细信息,请参阅Adobe Experience Platform文档

  4. 配置​ Enrichment ​活动。 在此上下文中,此活动的目的是标识传入数据。

    • 在​ Enrichment ​选项卡中,选择​ Add data ​并定义导入数据与收件人定向维度之间的链接。 在此示例中,CRM ID ​自定义字段用于创建连接条件。 只要允许标识唯一记录,就可以使用所需的字段或字段组合。
    • 在​ Reconciliation ​选项卡中,将​ Identify the document from the working data ​选项保留为未选中。

  5. 将​ Split ​活动配置为在一个过渡中检索已协调的收件人,以及在第二个过渡中无法协调但具有足够数据的收件人。

    然后,可以使用包含已协调收件人的过渡来更新数据库。 如果文件中具有最小信息集,则可以使用具有未知收件人的过渡在数据库中创建新收件人条目。

    无法协调且数据不足的收件人将在补充叫客过渡中选择,并可以在单独文件中导出或直接忽略。

    • 在活动的​ General ​选项卡中,选择​ Use the additional data only ​作为筛选设置,并确保自动将​ Targeting dimension ​设置为​ Enrichment

      选中​ Generate complement ​选项,以便能够查看数据库中是否不能插入任何记录。 如果需要,可以对补充数据执行进一步处理:文件导出、列表更新等。

    • 在​ Subsets ​选项卡的第一个子集中,为集客群体添加筛选条件,以仅选择收件人主键不等于0的记录。 这样,便在该子集中选择与来自数据库的收件人协调的文件中的数据。

    • 添加第二个子集,用于选择具有足够数据可插入数据库中的未协调记录。 例如:电子邮件地址、名字和姓氏。

      子集按其创建顺序进行处理,这意味着在处理第二个子集时,数据库中已存在的所有记录都已在第一个子集中被选择。

    • 在前两个子集中未选择的所有记录都在​ Complement ​中选择。

  6. 配置位于先前配置的​ Split ​活动的第一个叫客过渡之后的​ Update data ​活动。

    • 选择​ Update ​作为​ Operation type,因为集客过渡仅包含数据库中已存在的收件人。

    • 在​ Record identification ​部分中,选择​ Using reconciliation keys ​并定义定向维度与在​ Enrichment ​中创建的链接之间的键。 在此示例中,使用了​ CRM ID ​自定义字段。

    • 在​ Fields to update ​部分中,指示收件人维度中要使用文件中对应列的值更新的字段。 如果文件列的名称与收件人维字段的名称相同或几乎相同,则可以使用魔棒按钮自动匹配不同的字段。

  7. 配置位于包含未协调收件人的过渡之后的​ Deduplication ​活动:

    • 选择​ Edit configuration ​并将定向维度设置为从工作流的​ Enrichment ​活动生成的临时架构。

    • 在本例中,电子邮件字段用于查找独特的用户档案。 您可以使用任何确信已填充的字段以及唯一组合的一部分。

    • 在​ Deduplication method ​屏幕中,选择​ Advanced parameters ​并选中​ Disable automatic filtering of 0 ID records ​选项,以确保不排除主键等于0(应当为此过渡的所有记录)的记录。

  8. 配置位于之前配置的​ Deduplication ​活动之后的​ Update data ​活动。

    • 选择​ Insert ​作为​ Operation type,因为集客过渡仅包含数据库中不存在的收件人。

    • 在​ Record identification ​部分中,选择​ Directly using the targeting dimension ​并选择​ Recipients ​维度。

    • 在​ Fields to update ​部分中,指示收件人维度中要使用文件中对应列的值更新的字段。 如果文件列的名称与收件人维字段的名称相同或几乎相同,则可以使用魔棒按钮自动匹配不同的字段。

  9. 在​ Split ​活动的第三个过渡之后,如果要跟踪数据库中未插入的数据,请添加​ Data extraction (file) ​活动和​ File transfer ​活动。 配置这些活动以导出所需的列,并在FTP或SFTP服务器上传输文件,以便检索。

  10. 添加​ End ​活动并保存工作流模板。

现在可以使用该模板,并且该模板可用于每个新工作流。 然后,只需在​ Data loading (file) ​活动中指定包含导入数据的文件即可。

recommendation-more-help
cffff7e4-091f-472e-87ca-52087599f99d