2.4从离线源摄取数据

在本练习中,目标是在平台中载入外部数据,如CRM数据。

学习目标

  • 了解如何生成测试数据
  • 了解如何摄取CSV
  • 了解如何使用Web UI通过工作流进行数据摄取
  • 了解Experience Platform的数据管理功能

资源

任务

  • 创建具有演示日期的CSV文件。 利用可用的工作流,在Adobe Experience Platform中摄取CSV文件。
  • 了解Adobe Experience Platform中的数据管理选项

2.4.1通过数据生成器工具创建CRM数据集

为此,您需要1000行CRM数据示例。

转到https://www.mockaroo.com/12674210打开Mockaroo模板。

数据获取

在模板上,您会注意到以下字段:

  • id
  • first_name
  • last_name
  • 电子邮件
  • 性别
  • birthDate
  • home_latitude
  • home_longitude
  • country_code
  • city
  • 国家

所有这些字段都已定义为生成与Platform兼容的数据。

数据获取

要生成CSV文件,请单击​下载数据​按钮,该按钮将为您提供一个包含1000行演示数据的CSV文件。

在Microsoft Excel中打开CSV文件以可视化其内容。

数据获取

在CSV文件就绪后,您可以继续针对XDM映射它。

2.4.2在Adobe Experience Platform中验证CRM载入数据集

打开Adobe Experience Platform并转到​数据集

在继续操作之前,您需要选择​sandbox。 要选择的沙盒名为--module2sandbox--。 为此,可单击屏幕顶部蓝线中的文本​Production Prod

数据获取

从可用沙盒的列表中,选择与您分配的编号匹配的sandbox。

选择适当的sandbox后,您将看到屏幕发生更改,现在您位于专用的sandbox中。

数据获取

在Adobe Experience Platform中,单击屏幕左侧菜单中的​Datasets

数据获取

您将使用基于此启用的共享数据集。 共享数据集已创建,名为​演示系统 — CRM的配置文件数据集(全局v1.1)

数据获取

打开数据集​演示系统 — CRM(全局v1.1)​的配置文件数据集。

数据获取

在“概述”屏幕上,您可以看到3个主要信息。

数据获取

首先,数据集活动功能板显示数据集中CRM记录总数以及摄取的批次及其状态

数据获取

其次,通过在页面上向下滚动,可以检查摄取了多批数据,载入了多少条记录,以及是否成功载入了批记录。 批处理ID​是特定批处理作业的标识符,并且​批处理ID​很重要,因为它可用于解决特定批处理未成功载入的原因。

数据获取

最后, 数据集信息选项卡显示诸如数据集ID(同样,从故障排除角度来说也很重要)、数据集名称以及是否为“配置文件”启用了数据集等重要信息。

数据获取

此处最重要的设置是数据集与架构之间的链接。 架构定义可摄取的数据以及该数据的外观。

在本例中,我们使用的是​演示系统 — 用于CRM的配置文件架构(全局v1.1),该架构已映射到​配置文件​的类,并且已实施扩展(也称为字段组)。

数据获取

单击架构的名称后,您将转到架构概述,如果您可以看到已为此架构激活的所有字段。

数据获取

每个架构都需要定义一个自定义的主描述符。 对于CRM数据集,架构已定义字段​crmId​应为主标识符。 如果要创建架构并将其链接到实时客户配置文件,则需要定义引用主描述符的自定义字段组。

数据获取

在以上屏幕截图中,您可以看到我们的描述符位于--aepTenantId--.identification.core.crmId中,该描述符设置为主标识符,链接到​演示系统 — CRMID​的命名空间。

每个架构,以及同样的情况下,应在实时客户资料中使用的每个数据集都应具有一个主标识符。 此主标识符是该数据集中客户的品牌标识符用户。 对于CRM数据集,它可能是电子邮件地址或CRM ID,对于呼叫中心数据集,它可能是客户的移动电话号码。

最佳做法是为每个数据集创建一个单独的特定架构,并为每个数据集设置描述符,以专门匹配品牌使用的当前解决方案的运行方式。

2.4.3使用工作流将CSV文件映射到XDM模式

其目标是在平台中载入CRM数据。 在平台中摄取的所有数据都应映射到特定的XDM架构。 您当前拥有的是一个CSV数据集,其中一侧包含1000行,另一侧包含链接到架构的数据集。 要在该数据集中加载该CSV文件,需要进行映射。 为了促进此映射练习,我们在Adobe Experience Platform中提供了​工作流

数据获取

我们将在此使用的工作流是数据摄取菜单中名为​将CSV映射到XDM架构​的工作流。

单击​将CSV映射到XDM架构​按钮。

数据获取

单击​启动​以开始该过程。

数据获取

在下一个屏幕中,您需要选择一个数据集以将文件摄取到中。 您可以选择选择现有数据集,也可以选择创建新数据集。 在本练习中,我们将重复使用现有的一个:请按如下所示选择​演示系统 — CRM的配置文件数据集(全局v1.1),并将其他设置保留为默认设置。

数据获取

单击​Next​以转到下一步。

数据获取

拖放CSV文件或单击​浏览 ,然后在计算机上导航到桌面,然后选择CSV文件。

数据获取

选择CSV文件后,将立即上传该文件,您将在几秒内看到文件预览。

数据获取

单击​Next​以转到下一步。 文件完全处理可能需要几秒钟的时间。

数据获取

现在,该在​演示系统 — CRM的配置文件数据集​中将CSV列标题与XDM属性映射。

Adobe Experience Platform已经为您做了一些猜测,方法是尝试将源属性与目标架构字段链接。

数据获取

对于架构映射,Adobe Experience Platform已尝试将字段链接在一起。 但是,并非所有的测绘建议都是正确的。 现在,您需要逐个​接受目标字段

birthDate

“源架构”字段​birthDate​应该链接到目标字段​person.birthDate。 选中复选框。

数据获取

城市

“源架构”字段​city​应该链接到目标字段​homeAddress.city。 选中复选框。

数据获取

国家

源架构字段​国家/地区​应该链接到目标字段​homeAddress.country。 选中复选框。

数据获取

country_code

“源架构”字段​country_code​应该链接到目标字段​homeAddress.countryCode。 选中复选框。

数据获取

电子邮件

源架构字段​email​应该链接到目标字段​--aepTenantId--.identification.core.crmId。 将鼠标悬停在行​email​上,然后单击​+​图标。

数据获取

然后您将看到:

数据获取

导航到字段​--aepTenantId--.identification.core.crmId​并选择该字段。 单击​保存

数据获取

然后您将看到:

数据获取

first_name

源架构字段​first_name​应该链接到目标字段​person.name.firstName。 选中复选框。

数据获取

性别

“源架构”字段​gender​应链接到目标字段​person.gender。 选中复选框。

数据获取

home_latitude

源架构字段​home_latitude​应该链接到目标字段​homeAddress。_schema.latitude。 选中复选框。

数据获取

home_longitude

“源架构”字段​home_longitude​应该链接到目标字段​homeAddress。_schema.longitude。 选中复选框。

数据获取

id

源架构字段​id​应该链接到目标字段​_id。 将鼠标悬停在行​id​上,然后单击​+​图标。

数据获取

然后您将看到:

数据获取

导航到字段​_id​并选择该字段。 单击​保存

数据获取

然后您将看到:

数据获取

last_name

源架构字段​last_name​应该链接到目标字段​person.name.lastName。 选中复选框。

数据获取

您现在应该具有:

数据获取

单击​完成​按钮以完成工作流。

数据获取

单击​完成​后,您将看到​数据流​概述,几分钟后,您可以刷新屏幕以查看工作流是否成功完成。 单击您的​Target数据集名称

数据获取

然后,您将看到已处理摄取的数据集。

数据获取

在数据集上,您将看到刚刚摄取的批量ID,其中摄取了1000条记录,状态为​成功

数据获取

单击​预览数据集 — 按钮可快速查看数据集的小样本,以确保加载的数据正确无误。

数据获取

数据获取

加载数据后,您可以为数据集定义正确的数据管理方法。

2.5.4向数据集添加数据管理

现在,您已摄取客户数据,因此需要确保此数据集受到正确管理以用于使用和导出控制。 单击​数据管理​选项卡,并观察可以设置三种类型的限制:合同数据、身份数据和敏感数据。

您可以找到有关不同标签的更多信息以及将来如何通过此链接上的策略框架强制执行这些标签:https://www.adobe.io/apis/experienceplatform/home/dule/duleservices.html

数据获取

让我们限制整个数据集的身份数据。 将鼠标悬停在数据集名称上,然后单击“铅笔”图标以编辑设置。

数据获取

转到​Identity Data ,您将看到选中了​I2​选项 — 这将假定此数据集中的所有信息都至少可以间接识别给人员。

数据获取

单击​保存更改​并观察数据集中所有数据字段现在都设置了​I2

您还可以为单个数据字段设置这些标记 — 例如,对于直接可识别信息,firstName​字段可能会被分类为​I1​级别。

选中复选框并单击屏幕右上角的​编辑管理标签​以选择字段​firstName

数据获取

转到​Identity Data ,您将看到​I2​选项已选中(继承自数据集)。 字段firstName还具有字段特定的配置,并设置为​I1 - Directly Redibiliation Data

数据获取

借助此功能,您现在已在Adobe Experience Platform中成功摄取和分类CRM数据。

下一步:摘要和优点

返回到模块2

返回到所有模块

在此页面上