5.5将第二方和第三方数据摄取到Adobe Experience Platform

在本练习中,您将学习如何将第二方和第三方数据导入Informatica、加入数据集以及将转换后的数据作为Experience Events引入Adobe Experience Platform。

学习目标

  • 了解如何在Informatica中加载数据
  • 了解如何在Informatica中创建映射器工作流。
  • 了解在平台中加入数据集、丰富数据并将其摄取的过程。

实验室资源

实验室任务

  • 将CSV文件从S3存储段加载到离线订单和忠诚度计划用户档案的信息中
  • 创建映射器工作流以连接上述数据集,扩充和过滤数据。
  • 运行作业以将数据摄取到Adobe Experience Platform

业务上下文:使用Informatica将第二方和第三方数据摄取到平台

Luma零售时尚品牌与Survey Corp建立了合作关系,Survey Corp同意分享他们关于人们对设计师、颜色和品牌偏好的最新调查结果。 Luma Retail还决定从Money Corp购买一些有关市场的人口统计数据,提供有关人们收入和信用评分的详细信息。 Luma Retail将这两个数据集整合在一起,旨在根据客户的偏好和收入,为客户提供更有意义的体验。

5.4.1在映射工作流中创建源

在本练习中,您将从S3存储段将两个CSV文件加载到信息中:

  • 3rdparty_data.csv
  • survey_data.csv

转到https://apse1.dm-ap.informaticacloud.com/diUI/products/integrationDesign/main/home

使用电子邮件发送给您的凭据登录。

ETL

然后,您将看到Informatica主页。

ETL

在Informatica主页上,单击​+新建……​按钮。

ETL

然后,您将看到此弹出窗口。

ETL

在弹出菜单的左侧菜单中,选择​映射。 接下来,选择​映射

ETL

单击​创建​以开始创建映射工作流。

ETL

然后,您将看到此屏幕:

ETL

让我们首先配置映射的名称。 对于映射的名称,请使用LDAP - ex4。 在本例中,名称为vangeluw - ex4

ETL

单击屏幕右上角的​Save​以保存更改。

ETL

接下来,让我们开始创建映射工作流。 您的工作流当前如下所示。

ETL

我们先移除​Target​对象。 选择​Target​对象并单击​删除​图标。

ETL

在弹出窗口中单击​删除

ETL

您的工作流现在如下所示。

ETL

选择​Source​对象。 选择​Source​对象后,您将在屏幕底部看到“Properties(属性)”窗口。

ETL

在​属性​窗口中,单击​

ETL

打开​连接​下拉列表,找到S3 - LDAP连接并将其选中。

ETL

然后你会看到这个。

ETL

单击​选择……

ETL

然后,您将看到一个弹出窗口,其中显示您的S3连接。 在​​列中,您将看到存储段名称。 单击存储段名称以将其选中。

ETL

选择存储段名称后,您将在练习1中看到四个已上传到S3存储段的CSV文件。

选择文件3rdparty_data.csv,然后单击“确定”。

ETL

然后你会看到这个。

ETL

单击​格式设置选项​以定义模板的结构。

ETL

在弹出窗口中,将“格式类型”从​None​更改为​Delimited

ETL

接受默认设置,然后单击​确定

ETL

在“属性”屏幕上,单击​预览数据

ETL

然后,您应会看到与此类似的预览。 单击​完成​以关闭预览窗口。

ETL

如您在预览中所看到的,有多个空行,因此您必须先对文件进行一些清理,然后才能将其摄取到Adobe Experience Platform。

接下来,您将在映射工作流中设置第二个​Source​对象。

将​Source​对象从“设计概述”的左侧菜单拖放到画布上。

ETL

您现在应该具有以下设计:

ETL

选择第二个​​对象。 选择第二个​Source​对象后,屏幕底部将再次看到“属性”窗口。

在​属性​窗口中,单击​

ETL

打开​连接​下拉列表,找到S3 - LDAP连接并将其选中。

ETL

然后你会看到这个。

ETL

单击​选择……

ETL

然后,您将看到一个弹出窗口,其中显示您的S3连接。 在​​列中,您将看到存储段名称。 单击存储段名称以将其选中。

ETL

选择存储段名称后,您将在练习1中看到四个已上传到S3存储段的CSV文件。

选择文件survey_data.csv,然后单击“确定”。

ETL

然后你会看到这个。

ETL

单击​格式设置选项​以定义模板的结构。

ETL

在弹出窗口中,将“格式类型”从​None​更改为​Delimited

ETL

接受默认设置,然后单击​确定

ETL

在“属性”屏幕上,单击​预览数据

ETL

然后,您应会看到与此类似的预览。 单击​完成​以关闭预览窗口。

ETL

您现在已创建本练习所需的源连接器!

5.4.2连接源

在本练习中,您将加入上述创建的源。

您的映射工作流当前如下所示:

ETL

您现在需要加入这2个数据集。 实现此目的的方法是使用​Joiner。 在“设计”菜单中,向下滚动直到看到​Joiner​对象。

ETL

将​Joiner​对象拖放到画布上。

ETL

接下来,您必须将两个源连接到合并器。

单击“合并符”上的橙色​+​图标。 此时您将看到​主控​和​详细信息​节点。

ETL

将源连接到主控,将源1连接到详细信息,如下所示。

ETL

现在,让我们定义合并符的属性。

ETL

转到菜单选项​传入字段。 您将看到一条通知消息,指出2个源中的某些字段具有相同的名称。 我们先解决。

单击​解决字段名称冲突

ETL

你现在会看到这扇窗。

ETL

对于“主控”>“源”,打开​批量重命名选项​的下拉列表,然后选择​前缀

输入前缀m_

单击​确定

ETL

在“传入字段”屏幕中,您现在可以向下滚动,您将看到来自主控源的所有字段现在都有m_前缀,并且错误消息已消失。

ETL

接下来,您必须定义​连接条件。 单击左侧菜单中的​连接条件

然后你会看到这个。

ETL

单击小​+​图标。

然后,您将看到“连接条件”(Join Condition)。

ETL

将​Join Type​设置为​Full Outer,并将这2个字段相互连接:

m_email (string) = email (string)

ETL

完成后,单击​Save

ETL

您的2个源现已相互连接。

不要忘记单击​Save​以保存映射的当前状态。

ETL

5.4.3过滤数据

下一步是过滤数据。 具体而言,您需要删除潜在的空行,例如,如果存在空account_id。

要过滤数据,您需要在画布上添加一个​Filter​对象。 您可以在设计工作流的左侧菜单中找到​Filter​对象。

ETL

将​Filter​对象拖放到画布上。

ETL

接下来,查看​属性​窗口。

ETL

在左侧菜单中,转到​Filter

单击右侧的​+​图标以添加过滤器。

ETL

将​筛选条件​更改为​Advanced

ETL

单击​编辑过滤器条件​按钮。

ETL

在​Edit Filter-popup中,粘贴此过滤器:
IIF(ISNULL(m_email),FALSE,TRUE)

ETL

单击​确定​以保存您的过滤器。

您现在已定义过滤器,让我们扩充您的数据。

不要忘记单击​Save​以保存映射的当前状态。

ETL

5.4.4丰富数据

在扩充阶段,您可以向数据集添加其他字段或转换现有字段。 在本例中,我们需要转换现有字段m_yearly_income。 Luma Retail的营销人员不应看到个人收入数字,而应看到收入类别。
在这种情况下,Luma Retail已决定,如果某人的年收入超过100000/年,则应将其分类为具有high收入。 如果年收入在50000年至100000年/年之间,则应将其归类为medium收入;如果年收入低于50000年,则其分类为low收入。

要转换字段,您将使用​Expression,因此您需要在画布上添加​Expression​对象。 您可以在设计工作流的左侧菜单中找到​Expression​对象。

ETL

将​Expression​对象拖放到画布上。

ETL

接下来,查看​属性​窗口。

在左侧菜单中,转到​Expression

单击右侧的​+​图标以添加字段/表达式。

ETL

然后,您将看到此弹出窗口:

ETL

在弹出窗口中,定义字段名称和类型:

  • 字段名称: m_income
  • 类型:string
  • 精度:256

ETL

单击​确定​以保存字段。

然后您将看到:

ETL

单击​配置……

在​Edit Expression-popup中,粘贴此表达式:
IIF(TO_INTEGER(m_yearly_income) > 100000, 'high', IIF(TO_INTEGER(m_yearly_income) > 50000, 'medium', 'low'))

ETL

单击​OK​保存表达式。

现在,您已定义表达式,让我们将数据输出到Adobe Experience Platform。

不要忘记单击​Save​以保存映射的当前状态。

ETL

5.4.5将数据输出到Target

最后一步是将​Target​对象添加到工作流中。 从左侧菜单中,将​Target​对象拖放到画布上。

ETL

将​Expression​对象连接到​target​对象。

ETL

查看​Properties​窗口。

ETL

在左侧菜单中,转到​Target。 在连接下拉列表中,选择您的Adobe Experience Platform连接。

ETL

然后,您将拥有:

ETL

单击​Select​按钮以选择要使用的Adobe Experience Platform数据集。

输入搜索词ETL,然后单击​搜索。 然后,您将看到返回的这些数据集。

选择数据集Demo System - Profile Dataset for ETL (Global v1.1)

ETL

在“属性”窗口的左侧菜单中,转到​字段映射

ETL

将输出映射到架构属性,如下所示:

字段 元素名称
fav_designer --aepTenantId--.indivalCharacteries.retail.favoriteDesigner
fav_shop --aepTenantId--.indivalCheratives.retail.favoriteFashionBrand
fav_color --aepTenantId--.indivalCheratives.retail.favoriteColor
m_email --aepTenantId--.identification.core.email
m_id _id

您的字段映射应类似于此形式(请不要忘记m_email的映射)。

ETL

单击​保存

ETL

您现在已完成工作流,该工作流可以是​运行

ETL

单击屏幕右上角的​运行​按钮。

ETL

30秒后,您将看到此弹出窗口。 (注:可能需要很长时间,请稍等)

ETL

您需要将​运行时环境​更改为aepEmeaInformatica,如屏幕截图所示。 (如果未选择正确的运行时环境,则作业将无法成功运行)

ETL

单击​运行

ETL

20-30秒后,您的作业将会执行。

您可以转到左侧菜单选项​My Jobs​来查看作业的状态。

ETL

在列表中找到您的作业,然后单击该作业以将其打开。

ETL

然后,您将看到如下内容:

ETL

单击​刷新​按钮可查看更新。

ETL

成功完成作业后,将在Adobe Experience Platform中摄取数据。

登录到Adobe Experience Platform

登录后,您将登陆Adobe Experience Platform的主页。

数据获取

在继续操作之前,您需要选择​sandbox。 要选择的沙盒名为--aepSandboxId--。 为此,可单击屏幕顶部蓝线中的文本​Production Prod

数据获取

选择相应的沙盒后,您将看到屏幕发生更改,现在您就位于专用沙盒中。

数据获取

转到数据集并输入搜索词ETL。 然后,您将看到以下数据集:

ETL

打开数据集Demo System - Profile Dataset for ETL (Global v1.1)

ETL

向下滚动直到看到批ID并找到您的特定批。

ETL

根据需要记下批处理ID,以便提交完成模块5。

您还可以预览摄取的数据。

ETL

恭喜,您现在已成功使用Informatica将用户档案和体验事件数据摄取到Adobe Experience Platform!

下一步:摘要和优点

返回到模块5

返回到所有模块

在此页面上