创建用于导入数据的工作流模板 import-workflow-template
如果需要定期导入具有相同结构的文件,则使用导入模板是一种最佳实践。
此示例说明如何预先设置一个可重复使用的工作流,用于导入来自Adobe Campaign数据库中CRM的用户档案。
-
从 Resources > Templates > Workflow templates 创建新的工作流模板。
-
添加以下活动:
-
Load file:定义包含要导入的数据的文件的预期结构。
note note NOTE 您只能从单个文件导入数据。 如果工作流具有多个 Load file 活动,则每次都将使用相同的文件。 -
Reconciliation:使用数据库数据协调导入的数据。
-
Segmentation:创建过滤器以根据是否可以协调记录而采用不同方式处理记录。
-
Deduplication:在将数据插入数据库之前,从传入文件中删除重复数据。
-
Update data:使用导入的用户档案更新数据库。
-
-
配置 Load file 活动:
-
通过上传样例文件来定义预期的结构。 样例文件应仅包含几行,但应包含导入所需的所有列。 检查并编辑文件格式,确保正确设置了每列的类型:文本、日期、整数等。 例如:
code language-none lastname;firstname;birthdate;email;crmID Smith;Hayden;23/05/1989;hayden.smith@mailtest.com;123456
-
在 File to load 部分中,选择 Upload a new file from the local machine 并将字段留空。 每次从此模板创建新工作流时,只要该文件与定义的结构相对应,您就可以在此处指定所需的文件。
您可以使用任何选项,但必须相应地修改模板。 例如,如果选择 Use the file specified in the inbound transition,您可以先添加 Transfer file 活动,然后检索要从FTP/SFTP服务器导入的文件。
如果希望用户能够下载包含导入期间发生错误的文件,请选中 Keep the rejects in a file 选项并指定 File name。
-
-
配置 Reconciliation 活动。 在此上下文中,此活动的目的是标识传入数据。
- 在 Relations 选项卡中,选择 Create element 并定义导入数据与收件人定向维度之间的链接(请参阅定向维度和资源)。 在此示例中,CRM ID 自定义字段用于创建连接条件。 只要允许标识唯一记录,就可以使用所需的字段或字段组合。
- 在 Identification 选项卡中,将 Identify the document from the working data 选项保留为未选中。
-
将 Segmentation 活动配置为在一个过渡中检索已协调的收件人,以及在第二个过渡中无法协调但具有足够数据的收件人。
然后,可以使用包含已协调收件人的过渡来更新数据库。 如果文件中具有最小信息集,则可以使用具有未知收件人的过渡在数据库中创建新收件人条目。
无法协调且数据不足的收件人将在补充叫客过渡中选择,并可以在单独文件中导出或直接忽略。
-
在活动的 General 选项卡中,将 Resource type 设置为 Temporary resource 并选择 Reconciliation 作为目标集。
-
在 Advanced options 选项卡中,选中 Generate complement 选项以查看数据库中是否不能插入任何记录。 如果需要,可以对补充数据执行进一步处理:文件导出、列表更新等。
-
在 Segments 选项卡的第一个区段中,为集客群体添加筛选条件,以仅选择用户档案的CRM ID不等于0的记录。 这样,来自与来自数据库的用户档案协调的文件的数据便在该子集中被选择。
-
添加第二个区段,用于选择具有足够数据可插入数据库中的未协调记录。 例如:电子邮件地址、名字和姓氏。 未协调的记录其配置文件的CRM ID值等于0。
-
在前两个子集中未选择的所有记录都在 Complement 中选择。
-
-
配置位于先前配置的 Segmentation 活动的第一个叫客过渡之后的 Update data 活动。
-
选择 Update 作为 Operation type,因为集客过渡仅包含数据库中已存在的收件人。
-
在 Identification 选项卡中,选择 Using reconciliation criteria 并定义 Dimension to update — 在此例中是配置文件 — 与 Reconciliation 活动中创建的链接之间的键。 在此示例中,使用了 CRM ID 自定义字段。
-
在 Fields to update 选项卡中,指示要用文件中对应列的值更新的用户档案维度中的字段。 如果文件列的名称与收件人维字段的名称相同或几乎相同,则可以使用魔棒按钮自动匹配不同的字段。
note note NOTE 如果您计划向这些用户档案发送直邮,请确保包含邮政地址,因为此信息对直邮提供商至关重要。 另请确保已选中用户档案信息中的 Address specified 框。 若要从工作流更新此选项,只需向要更新的字段添加一个元素,并将 1 指定为 Source,并选择 postalAddress/@addrDefined
字段作为 Destination 即可。 有关直邮和 Address specified 选项用法的详细信息,请参阅本文档。
-
-
配置位于包含未协调配置文件的过渡之后的 Deduplication 活动:
-
在 Properties 选项卡中,将 Resource type 设置为从工作流的 Reconciliation 活动生成的临时资源。
-
在本例中,电子邮件字段用于查找独特的用户档案。 您可以使用任何确信已填充的字段以及唯一组合的一部分。
-
选择 Deduplication method。 在这种情况下,应用程序会自动决定要保留哪些记录以防出现重复项。
-
-
配置位于之前配置的 Deduplication 活动之后的 Update data 活动。
-
选择 Insert only 作为 Operation type,因为集客过渡仅包含数据库中不存在的配置文件。
-
在 Identification 选项卡中,选择 Using reconciliation criteria 并定义 Dimension to update — 在此例中是配置文件 — 与 Reconciliation 活动中创建的链接之间的键。 在此示例中,使用了 CRM ID 自定义字段。
-
在 Fields to update 选项卡中,指示要用文件中对应列的值更新的用户档案维度中的字段。 如果文件列的名称与收件人维字段的名称相同或几乎相同,则可以使用魔棒按钮自动匹配不同的字段。
note note NOTE 如果您计划向这些用户档案发送直邮,请确保包含邮政地址,因为此信息对直邮提供商至关重要。 另请确保已选中用户档案信息中的 Address specified 框。 若要从工作流更新此选项,只需在要更新的字段中添加元素,并将 1 指定为 Source,并选择**[postalAddress/@addrDefined]字段作为 Destination**即可。 有关直邮和 Address specified 选项用法的详细信息,请参阅本文档。
-
-
在 Segmentation 活动的第三个过渡之后,如果要跟踪数据库中未插入的数据,请添加 Extract file 活动和 Transfer file 活动。 配置这些活动以导出所需的列,并在FTP或SFTP服务器上传输文件,以便检索。
-
添加 End 活动并保存工作流模板。
现在可以使用该模板,并且该模板可用于每个新工作流。 然后,只需在 Load file 活动中指定包含导入数据的文件即可。