在本练习中,您将学习如何将第二方和第三方数据导入Informatica、加入数据集以及将转换后的数据作为Experience Events引入Adobe Experience Platform。
Luma零售时尚品牌与Survey Corp建立了合作关系,Survey Corp同意分享他们关于人们对设计师、颜色和品牌偏好的最新调查结果。 Luma Retail还决定从Money Corp购买一些有关市场的人口统计数据,提供有关人们收入和信用评分的详细信息。 Luma Retail将这两个数据集整合在一起,旨在根据客户的偏好和收入,为客户提供更有意义的体验。
在本练习中,您将从S3存储段将两个CSV文件加载到信息中:
3rdparty_data.csv
survey_data.csv
转到https://apse1.dm-ap.informaticacloud.com/diUI/products/integrationDesign/main/home。
使用电子邮件发送给您的凭据登录。
然后,您将看到Informatica主页。
在Informatica主页上,单击+新建……按钮。
然后,您将看到此弹出窗口。
在弹出菜单的左侧菜单中,选择映射。 接下来,选择映射。
单击创建以开始创建映射工作流。
然后,您将看到此屏幕:
让我们首先配置映射的名称。 对于映射的名称,请使用LDAP - ex4
。 在本例中,名称为vangeluw - ex4
。
单击屏幕右上角的Save以保存更改。
接下来,让我们开始创建映射工作流。 您的工作流当前如下所示。
我们先移除Target对象。 选择Target对象并单击删除图标。
在弹出窗口中单击删除。
您的工作流现在如下所示。
选择Source对象。 选择Source对象后,您将在屏幕底部看到“Properties(属性)”窗口。
在属性窗口中,单击源。
打开连接下拉列表,找到S3 - LDAP
连接并将其选中。
然后你会看到这个。
单击选择……。
然后,您将看到一个弹出窗口,其中显示您的S3连接。 在包列中,您将看到存储段名称。 单击存储段名称以将其选中。
选择存储段名称后,您将在练习1中看到四个已上传到S3存储段的CSV文件。
选择文件3rdparty_data.csv
,然后单击“确定”。
然后你会看到这个。
单击格式设置选项以定义模板的结构。
在弹出窗口中,将“格式类型”从None更改为Delimited。
接受默认设置,然后单击确定。
在“属性”屏幕上,单击预览数据。
然后,您应会看到与此类似的预览。 单击完成以关闭预览窗口。
如您在预览中所看到的,有多个空行,因此您必须先对文件进行一些清理,然后才能将其摄取到Adobe Experience Platform。
接下来,您将在映射工作流中设置第二个Source对象。
将Source对象从“设计概述”的左侧菜单拖放到画布上。
您现在应该具有以下设计:
选择第二个源对象。 选择第二个Source对象后,屏幕底部将再次看到“属性”窗口。
在属性窗口中,单击源。
打开连接下拉列表,找到S3 - LDAP
连接并将其选中。
然后你会看到这个。
单击选择……。
然后,您将看到一个弹出窗口,其中显示您的S3连接。 在包列中,您将看到存储段名称。 单击存储段名称以将其选中。
选择存储段名称后,您将在练习1中看到四个已上传到S3存储段的CSV文件。
选择文件survey_data.csv
,然后单击“确定”。
然后你会看到这个。
单击格式设置选项以定义模板的结构。
在弹出窗口中,将“格式类型”从None更改为Delimited。
接受默认设置,然后单击确定。
在“属性”屏幕上,单击预览数据。
然后,您应会看到与此类似的预览。 单击完成以关闭预览窗口。
您现在已创建本练习所需的源连接器!
在本练习中,您将加入上述创建的源。
您的映射工作流当前如下所示:
您现在需要加入这2个数据集。 实现此目的的方法是使用Joiner。 在“设计”菜单中,向下滚动直到看到Joiner对象。
将Joiner对象拖放到画布上。
接下来,您必须将两个源连接到合并器。
单击“合并符”上的橙色+图标。 此时您将看到主控和详细信息节点。
将源连接到主控,将源1连接到详细信息,如下所示。
现在,让我们定义合并符的属性。
转到菜单选项传入字段。 您将看到一条通知消息,指出2个源中的某些字段具有相同的名称。 我们先解决。
单击解决字段名称冲突。
你现在会看到这扇窗。
对于“主控”>“源”,打开批量重命名选项的下拉列表,然后选择前缀。
输入前缀m_
。
单击确定。
在“传入字段”屏幕中,您现在可以向下滚动,您将看到来自主控源的所有字段现在都有m_
前缀,并且错误消息已消失。
接下来,您必须定义连接条件。 单击左侧菜单中的连接条件。
然后你会看到这个。
单击小+图标。
然后,您将看到“连接条件”(Join Condition)。
将Join Type设置为Full Outer,并将这2个字段相互连接:
m_email (string)
= email (string)
完成后,单击Save。
您的2个源现已相互连接。
不要忘记单击Save以保存映射的当前状态。
下一步是过滤数据。 具体而言,您需要删除潜在的空行,例如,如果存在空account_id。
要过滤数据,您需要在画布上添加一个Filter对象。 您可以在设计工作流的左侧菜单中找到Filter对象。
将Filter对象拖放到画布上。
接下来,查看属性窗口。
在左侧菜单中,转到Filter。
单击右侧的+图标以添加过滤器。
将筛选条件更改为Advanced。
单击编辑过滤器条件按钮。
在Edit Filter-popup中,粘贴此过滤器:
IIF(ISNULL(m_email),FALSE,TRUE)
单击确定以保存您的过滤器。
您现在已定义过滤器,让我们扩充您的数据。
不要忘记单击Save以保存映射的当前状态。
在扩充阶段,您可以向数据集添加其他字段或转换现有字段。 在本例中,我们需要转换现有字段m_yearly_income
。 Luma Retail的营销人员不应看到个人收入数字,而应看到收入类别。
在这种情况下,Luma Retail已决定,如果某人的年收入超过100000/年,则应将其分类为具有high
收入。 如果年收入在50000年至100000年/年之间,则应将其归类为medium
收入;如果年收入低于50000年,则其分类为low
收入。
要转换字段,您将使用Expression,因此您需要在画布上添加Expression对象。 您可以在设计工作流的左侧菜单中找到Expression对象。
将Expression对象拖放到画布上。
接下来,查看属性窗口。
在左侧菜单中,转到Expression。
单击右侧的+图标以添加字段/表达式。
然后,您将看到此弹出窗口:
在弹出窗口中,定义字段名称和类型:
m_income
string
256
单击确定以保存字段。
然后您将看到:
单击配置……
在Edit Expression-popup中,粘贴此表达式:
IIF(TO_INTEGER(m_yearly_income) > 100000, 'high', IIF(TO_INTEGER(m_yearly_income) > 50000, 'medium', 'low'))
单击OK保存表达式。
现在,您已定义表达式,让我们将数据输出到Adobe Experience Platform。
不要忘记单击Save以保存映射的当前状态。
最后一步是将Target对象添加到工作流中。 从左侧菜单中,将Target对象拖放到画布上。
将Expression对象连接到target对象。
查看Properties窗口。
在左侧菜单中,转到Target。 在连接下拉列表中,选择您的Adobe Experience Platform连接。
然后,您将拥有:
单击Select按钮以选择要使用的Adobe Experience Platform数据集。
输入搜索词ETL
,然后单击搜索。 然后,您将看到返回的这些数据集。
选择数据集Demo System - Profile Dataset for ETL (Global v1.1)
。
在“属性”窗口的左侧菜单中,转到字段映射。
将输出映射到架构属性,如下所示:
字段 | 元素名称 |
---|---|
fav_designer | --aepTenantId-- .indivalCharacteries.retail.favoriteDesigner |
fav_shop | --aepTenantId-- .indivalCheratives.retail.favoriteFashionBrand |
fav_color | --aepTenantId-- .indivalCheratives.retail.favoriteColor |
m_email | --aepTenantId-- .identification.core.email |
m_id | _id |
您的字段映射应类似于此形式(请不要忘记m_email的映射)。
单击保存。
您现在已完成工作流,该工作流可以是运行。
单击屏幕右上角的运行按钮。
30秒后,您将看到此弹出窗口。 (注:可能需要很长时间,请稍等)
您需要将运行时环境更改为aepEmeaInformatica
,如屏幕截图所示。 (如果未选择正确的运行时环境,则作业将无法成功运行)
单击运行。
20-30秒后,您的作业将会执行。
您可以转到左侧菜单选项My Jobs来查看作业的状态。
在列表中找到您的作业,然后单击该作业以将其打开。
然后,您将看到如下内容:
单击刷新按钮可查看更新。
成功完成作业后,将在Adobe Experience Platform中摄取数据。
登录后,您将登陆Adobe Experience Platform的主页。
在继续操作之前,您需要选择sandbox。 要选择的沙盒名为--aepSandboxId--
。 为此,可单击屏幕顶部蓝线中的文本Production Prod。
选择相应的沙盒后,您将看到屏幕发生更改,现在您就位于专用沙盒中。
转到数据集并输入搜索词ETL
。 然后,您将看到以下数据集:
打开数据集Demo System - Profile Dataset for ETL (Global v1.1)
。
向下滚动直到看到批ID并找到您的特定批。
根据需要记下批处理ID,以便提交完成模块5。
您还可以预览摄取的数据。
恭喜,您现在已成功使用Informatica将用户档案和体验事件数据摄取到Adobe Experience Platform!
下一步:摘要和优点