1.2.4从离线来源摄取数据
在本练习中,目标是载入外部数据,如Platform中的CRM数据。
学习目标
- 了解如何生成测试数据
- 了解如何摄取CSV
- 了解如何使用Web UI通过工作流摄取数据
- 了解Experience Platform的数据治理功能
资源
- 莫卡鲁: https://www.mockaroo.com/
- Adobe Experience Platform: https://experience.adobe.com/platform/
任务
- 创建包含演示数据的CSV文件。 使用可用的工作流在Adobe Experience Platform中摄取CSV文件。
- 了解Adobe Experience Platform中的数据治理选项
使用数据生成器工具创建CRM数据集
在本练习中,您需要1000个CRM数据示例行。
转到https://www.mockaroo.com/12674210打开Mockaroo模板。
在模板上,您会注意到以下字段:
- ID
- 名字
- last_name
- 电子邮件
- 性别
- birthDate
- home_latitude
- home_longiture
- country_code
- 城市
- 国家/地区
- crmId
- consent.email
- consent.commercialEmail
- consent.any
所有这些字段都是为了生成与Platform兼容的数据而定义的。
要生成CSV文件,请单击 生成数据 按钮,该按钮将创建和下载包含1000行演示数据的CSV文件。
打开CSV文件以可视化其内容。
准备好CSV文件后,您可以在AEP中继续摄取。
验证数据集
转到https://experience.adobe.com/platform。
在继续之前,您需要选择一个沙盒。 要选择的沙盒名为--aepSandboxName--。
在Adobe Experience Platform中,单击屏幕左侧菜单中的数据集。
您将使用共享数据集。 已创建共享数据集,其名称为Demo System - CRM的配置文件数据集(Global v1.1)。 单击以将其打开。
在概述屏幕上,您可以看到3条主要信息。
首先,数据集活动仪表板显示数据集中的CRM记录总数以及摄取的批次及其状态
其次,通过在页面上向下滚动,您可以检查何时摄取批量数据、载入了多少记录,以及是否成功载入了批次。 批次ID是特定批次作业的标识符,而 批次ID 很重要,因为它可用于解决特定批次未成功载入的原因。
最后,数据集信息选项卡显示诸如数据集ID等重要信息(从故障排除的角度来说,同样非常重要)、数据集的名称以及是否为配置文件启用了数据集。
此处最重要的设置是数据集与架构之间的链接。 架构定义可以摄取哪些数据以及这些数据的外观。
在本例中,我们使用的是CRM (Global v1.1)的 Demo System - Profile Schema,该架构映射到 Profile 的类并已实施扩展(也称为字段组)。
通过单击架构的名称,您会进入架构概述,您可以看到已为此架构激活的所有字段。
每个架构都需要定义一个自定义的主描述符。 在我们CRM数据集的情况下,架构已定义字段 crmId 应是主要标识符。 如果要创建架构并将其链接到实时客户个人资料,您需要定义一个引用您的主描述符的自定义字段组。
您还可以看到我们的主要标识位于--aepTenantId--.identification.core.crmId中,链接到 演示系统 — CRMID 的命名空间。
每个架构以及应在实时客户个人资料中使用的每个数据集都应有一个主标识符。 此主要标识符是该数据集中的品牌客户的标识符用户。 对于CRM数据集,它可能是电子邮件地址或CRM ID;对于呼叫中心数据集,它可能是客户的手机号码。
最佳实践是为每个数据集创建单独的特定架构,并为每个数据集设置描述符,以专门匹配品牌使用的当前解决方案的运行方式。
使用工作流将CSV文件映射到XDM架构
本练习的目标是在AEP中载入CRM数据。 在Platform中引入的所有数据都应针对特定的XDM架构进行映射。 您当前拥有的CSV数据集在一侧具有1000行,并且数据集链接到另一侧的架构。 要在该数据集中加载该CSV文件,需要执行映射。 为了便于此映射练习,我们在Adobe Experience Platform中提供了工作流。
单击将CSV映射到XDM架构,然后单击 启动 以开始此过程。
在下一个屏幕上,您需要选择一个数据集以摄取文件。 您可以选择选择现有的数据集或创建新数据集。 对于本练习,我们将重复使用现有的演示系统:请按如下所述选择 演示系统 — 用于CRM (Global v1.1) 的配置文件数据集,并将其他设置保留为默认设置。
单击下一步。
拖放您的CSV文件或单击选择文件,在您的计算机上导航到桌面并选择您的CSV文件。
选择CSV文件后,它将立即上传,您将在几秒钟内看到文件预览。
单击下一步。
现在,您需要在 演示系统 — CRM 的配置文件数据集中使用XDM — 属性映射CSV文件中的列标题。
Adobe Experience Platform已为您提出了一些建议,方法是尝试将Source属性与目标架构字段链接。
对于架构映射,Adobe Experience Platform已尝试将字段链接在一起。 但是,并非所有映射建议都是正确的。 您现在需要逐一更新目标字段。
birthDate
Source架构字段 birthDate 应链接到目标字段person.birthDate。
城市
Source架构字段 city 应链接到目标字段homeAddress.city。
国家/地区
Source架构字段 country 应链接到目标字段homeAddress.country。
country_code
Source架构字段 country_code 应链接到目标字段homeAddress.countryCode。
电子邮件
Source架构字段 电子邮件 应链接到目标字段personalEmail.address。
crmid
Source架构字段 crmid 应链接到目标字段--aepTenantId--.identification.core.crmId。
名字
Source架构字段 first_name 应链接到目标字段person.name.firstName。
性别
Source架构字段 gender 应链接到目标字段person.gender。
home_latitude
Source架构字段 home_latitude 应链接到目标字段homeAddress。_schema.latitude。
home_longiture
Source架构字段 home_longitude 应链接到目标字段homeAddress。_schema.longitude。
ID
Source架构字段 id 应链接到目标字段_id。
last_name
Source架构字段 last_name 应链接到目标字段person.name.lastName。
consents.marketing.email.val
Source架构字段 consent.email 应链接到目标字段consent.marketing.email.val。
consents.marketing.commercialEmail.val
Source架构字段 consent.commercialEmail 应链接到目标字段consent.marketing.commercialEmail.val。
consents.marketing.any.val
Source架构字段 consent.any 应链接到目标字段consent.marketing.any.val。
您现在应该拥有此项。 单击完成。
单击 完成 后,您将看到 数据流 概述,几分钟后,您可以刷新屏幕以查看工作流是否成功完成。 单击您的目标数据集名称。
然后,您将看到已处理您的摄取的数据集,并看到刚刚被摄取的批次ID,其中已摄取1000条记录,状态为成功。 单击预览数据集。
现在,您将看到一个数据集的小示例,以确保加载的数据正确。
加载数据后,您可以为数据集定义正确的数据治理方法。
向数据集添加数据管理
现在您的客户数据已被摄取,您需要确保针对使用和导出控制对此数据集进行正确管理。 单击 数据管理 选项卡,并观察到,您可以设置多种类型的限制:合同、身份和敏感、合作伙伴生态系统和自定义。
让我们限制整个数据集的身份数据。 将鼠标悬停在数据集名称上,然后单击铅笔图标以编辑设置。
转到身份标签,您将看到已选中 I2 选项 — 这将假定此数据集中的所有信息段至少可间接识别给人员。
单击保存更改。
在另一个模块中,我们将深入探讨数据治理和标签的“谁”框架。
现在,借助此功能,您已成功摄取并分类Adobe Experience Platform中的CRM数据。
后续步骤
返回数据摄取
返回所有模块