5.4将离线订单事件摄取到Adobe Experience Platform

在本练习中,您将学习如何将订单数据导入Informatica、加入数据集以及将转换后的数据作为Experience Events摄取到Adobe Experience Platform。

学习目标

  • 了解如何在Informatica中加载数据
  • 了解如何在Informatica中创建映射器工作流。
  • 了解在平台中加入数据集、丰富数据并将其摄取的过程。

实验室资源

实验室任务

  • 将CSV文件从S3存储段加载到离线订单和忠诚度计划用户档案的信息中
  • 创建映射器工作流以连接上述数据集,扩充和过滤数据。
  • 运行作业以将数据摄取到Adobe Experience Platform

业务上下文:使用Informatica将离线订单事件摄取到Platform

Luma是一个时尚品牌,除了在线业务外,还在世界各地设有实体店。 迄今为止,营销团队一直难以利用离线订单数据来优化其在线体验。 最近,他们引入了新的忠诚度计划,允许客户在使用忠诚卡在店内购买时收集积分。 营销团队会定期收到包含所有离线订单的平面文件。 他们还记录了已加入忠诚度计划的所有客户。 在Informatica的帮助下,我们将加入这两个数据源,丰富结果以便将其摄取到Adobe Experience Platform中,然后利用离线订单事件对用户档案进行水合。

练习5.3.1 — 在映射工作流中创建源

在本练习中,您将从S3存储段将两个CSV文件加载到信息中:

  • offline_orders.csv
  • loyatic_data.csv

转到https://apse1.dm-ap.informaticacloud.com/cloudshell/showProducts

使用电子邮件发送给您的凭据登录。

ETL

然后,您将看到Informatica主页。 转到​数据集成

ETL

在Informatica主页上,单击​+新建……​按钮。

ETL

然后,您将看到此弹出窗口。

ETL

在弹出菜单的左侧菜单中,选择​映射。 接下来,选择​映射

ETL

单击​创建​以开始创建映射工作流。

ETL

然后,您将看到此屏幕:

ETL

让我们首先配置映射的名称。 对于映射的名称,请使用​LDAP - ex3。 在此示例中,名称为​vangeluw - ex3

ETL

单击屏幕右上角的​Save​以保存更改。

ETL

接下来,让我们开始创建映射工作流。 您的工作流当前如下所示。

ETL

我们先移除​Target​对象。 选择​Target​对象并单击​删除​图标。

ETL

在弹出窗口中单击​删除

ETL

您的工作流现在如下所示。

ETL

选择​Source​对象。 选择​Source​对象后,您将在屏幕底部看到“Properties(属性)”窗口。

ETL

在​属性​窗口中,单击​

ETL

打开​连接​下拉列表,找到​S3 - LDAP​连接并选择它。

ETL

然后你会看到这个。

ETL

单击​选择……

ETL

然后,您将看到一个弹出窗口,其中显示您的S3连接。 在​​列中,您将看到存储段名称。 单击存储段名称以将其选中。

ETL

选择存储段名称后,您将在练习5.1中看到四个已上传到S3存储段的CSV文件。

选择文件​offline_orders.csv,然后单击“确定”。

ETL

然后你会看到这个。

ETL

在​格式​下拉列表中,将格式类型从​​更改为​分隔

ETL

单击​格式设置选项

ETL

在“属性”屏幕上,单击​数据预览

ETL

然后,您应会看到与此类似的预览。 单击​完成​以关闭预览窗口。

ETL

刚作为源加载的文件具有以下列:

栏目 描述
id 行号
timestamp 购买产品时的时间戳
account_id 会员计划帐户ID
产品 产品 SKU
价格 产品价格
currency 产品价格的币种

如您在预览中所看到的,有多个空行,因此您必须先对文件进行一些清理,然后才能将其摄取到Adobe Experience Platform。

接下来,您将在映射工作流中设置第二个​Source​对象。

将​Source​对象从“设计概述”的左侧菜单拖放到画布上。

ETL

您现在应该具有以下设计:

ETL

选择第二个​​对象。 选择第二个​Source​对象后,屏幕底部将再次看到“属性”窗口。

在​属性​窗口中,单击​

ETL

打开​连接​下拉列表,找到​S3 - LDAP​连接并选择它。

ETL

然后你会看到这个。

ETL

单击​选择……

ETL

然后,您将看到一个弹出窗口,其中显示您的S3连接。 在​​列中,您将看到存储段名称。 单击存储段名称以将其选中。

ETL

选择存储段名称后,您将在练习1中看到四个已上传到S3存储段的CSV文件。

选择文件​loyaty_data.csv,然后单击确定。

ETL

然后你会看到这个。

ETL

在​格式​下拉列表中,将格式类型从​​更改为​分隔

ETL

然后你会得到这个。

ETL

单击​格式设置选项

ETL

在“属性”屏幕上,单击​数据预览

ETL

然后,您应会看到与此类似的预览。 单击​完成​以关闭预览窗口。

ETL

刚作为源加载的文件具有以下列:

栏目 描述
account_id 会员计划帐户ID
first_name 客户的名字
last_name 客户的姓氏
电子邮件 客户的电子邮件地址
性别 客户性别
客户收集的点数

您现在已创建本练习所需的源连接器!

练习5.3.2 — 加入源

在本练习中,您将加入上述创建的源。

您的映射工作流当前如下所示:

ETL

您现在需要加入这2个数据集。 实现此目的的方法是使用​Joiner。 在“设计”菜单中,向下滚动,直到看到​Joiner​对象。

ETL

将​Joiner​对象拖放到画布上。

ETL

接下来,您必须将两个源连接到合并器。

单击“合并符”上的橙色​+​图标。 此时您将看到​主控​和​详细信息​节点。

ETL

将源连接到主控,将源1连接到详细信息,如下所示。

ETL

现在,让我们定义合并符的属性。

ETL

转到菜单选项​传入字段。 您将看到一条通知消息,指出两个源中的某些字段具有相同的名称。 我们先解决。

单击​解决字段名称冲突

ETL

你现在会看到这扇窗。

ETL

对于“主控”>“源”,打开​批量重命名选项​的下拉列表,然后选择​前缀

输入前缀​m_

单击​确定

ETL

在“传入字段”屏幕中,您现在可以向下滚动,您将看到来自主控源的所有字段现在都有m_前缀,并且错误消息已消失。

ETL

接下来,您必须定义​连接条件。 单击左侧菜单中的​连接条件

然后你会看到这个。

ETL

单击小​+​图标。

然后,您将看到“连接条件”(Join Condition)。

ETL

将以下2个字段相互连接:

m_account_id (string) = account_id (string)

ETL

完成后,单击​Save

ETL

您的两个源现在相互连接。

不要忘记单击​Save​以保存映射的当前状态。

ETL

练习5.3.3 — 过滤数据

下一步是过滤数据。 具体而言,您需要删除潜在的空行,例如,如果存在空account_id。

要过滤数据,您需要在画布上添加一个​Filter​对象。 您可以在设计工作流的左侧菜单中找到​Filter​对象。

ETL

将​Filter​对象拖放到画布上。

ETL

接下来,查看​属性​窗口。

ETL

在左侧菜单中,转到​Filter

单击右侧的​+​图标以添加过滤器。

ETL

将​筛选条件​更改为​Advanced

ETL

单击​编辑过滤器条件​按钮。

ETL

在​Edit Filter-popup中,粘贴此过滤器:
IIF(ISNULL(account_id),FALSE,TRUE)

ETL

单击​确定​以保存您的过滤器。

您现在已定义过滤器,让我们扩充您的数据。

不要忘记单击​Save​以保存映射的当前状态。

ETL

练习5.3.4 — 丰富数据

在扩充阶段,您可以向数据集添加其他字段。 在此示例中,我们需要在摄取体验事件数据时为Adobe Experience Platform提供唯一的hitId。 此hitId尚未包含在数据集中,因此您现在将使用​Expression​添加该数据集。

要扩充数据,您需要在画布上添加一个​Expression​对象。 您可以在设计工作流的左侧菜单中找到​Expression​对象。

ETL

将​Expression​对象拖放到画布上。

ETL

接下来,查看​属性​窗口。

在左侧菜单中,转到​Expression

单击右侧的​+​图标以添加字段/表达式。

ETL

然后,您将看到此弹出窗口:

ETL

在弹出窗口中,定义字段名称和类型:

  • 名称: hitId
  • 类型:bigint

ETL

单击​确定​以保存字段。

然后您将看到:

ETL

单击​配置……

在​Edit Expression-popup中,粘贴此表达式:
rand() * 1000000000000

ETL

单击​OK​保存表达式。

现在,您已定义表达式,让我们将数据输出到Adobe Experience Platform。

不要忘记单击​Save​以保存映射的当前状态。

ETL

练习5.3.5 — 将数据输出到Target

最后一步是将​Target​对象添加到工作流中。 从左侧菜单中,将​Target​对象拖放到画布上。

ETL

将​Expression​对象连接到​target​对象。

ETL

查看​Properties​窗口。

ETL

在左侧菜单中,转到​Target。 在连接下拉列表中,选择您之前创建的Adobe Experience Platform连接器。

ETL

然后,您将拥有:

ETL

单击​Select​按钮以选择要使用的Adobe Experience Platform数据集。

输入搜索词ETL,然后单击​搜索。 然后,您将看到返回的这些数据集。

选择数据集Demo System - Event Dataset for ETL (Global v1.1)

ETL

在“属性”窗口的左侧菜单中,转到​字段映射

ETL

将输出映射到架构属性,如下所示:

字段 元素名称
m_timestamp timestamp
m_product productListItemsArray.productListItems.name
m_product productListItemsArray.productListItems.SKU
m_currency commerce.order.currencyCode
电子邮件 --aepTenantId--.identification.core.email
hitID _id

您的字段映射应如下所示(请不要忘记m_email的映射)。

ETL

单击​保存

ETL

您现在已完成工作流,该工作流可以是​运行

ETL

单击屏幕右上角的​运行​按钮。

ETL

30秒后,您将看到此弹出窗口。 (注:可能需要很长时间,请稍等)

ETL

您需要将​运行时环境​更改为在上一个练习中创建的运行时环境,就像屏幕截图中一样。 (如果未选择正确的运行时环境,则作业将无法成功运行)

ETL

单击​运行

ETL

20-30秒后,您的作业将会执行。

您可以转到左侧菜单选项​My Jobs​来查看作业的状态。

ETL

在列表中找到您的作业,然后单击该作业以将其打开。

ETL

然后,您将看到如下内容:

ETL

单击​刷新​按钮可查看更新。

ETL

成功完成作业后,将在Adobe Experience Platform中摄取数据。

ETL

登录到Adobe Experience Platform

登录后,您将登陆Adobe Experience Platform的主页。

数据获取

在继续操作之前,您需要选择​sandbox。 要选择的沙盒名为--aepSandboxId--。 为此,可单击屏幕顶部蓝线中的文本​Production Prod

数据获取

选择相应的沙盒后,您将看到屏幕发生更改,现在您就位于专用沙盒中。

数据获取

转到数据集并输入搜索词ETL。 然后,您将看到以下数据集:

ETL

打开数据集Demo System - Event Dataset for ETL (Global v1.1)。 向下滚动直到看到批ID并找到您的特定批。

ETL

您现在可以继续下一个练习。

下一步:5.5将第2方和第3方数据摄取到Adobe Experience Platform

返回到模块5

返回到所有模块

在此页面上