[Beta 版]{class="badge informative"}
在UI中创建Merkury Enterprise Identity Resolution源连接和数据流
本教程提供了使用Adobe Experience Platform用户界面创建Merkury Enterprise Identity Resolution源连接和数据流的步骤。
快速入门
本教程需要对以下Experience Platform组件有一定的了解:
-
Experience Data Model (XDM) 系统:Experience Platform用于组织客户体验数据的标准化框架。
-
Real-Time Customer Profile:根据来自多个源的汇总数据,提供统一的实时使用者个人资料。
收集所需的凭据
要在Experience Platform时访问存储段,您需要为以下凭据提供有效值:
有关为Merkury设置和其他先决条件的详细信息,请阅读Merkury 源概述。
连接您的Merkury帐户
在Platform UI中,从左侧导航栏中选择 源 以访问源工作区。 Catalog屏幕显示您可以为其创建帐户的各种源。
您可以从屏幕左侧的目录中选择相应的类别。 或者,您可以使用搜索选项查找您要使用的特定源。
在 数据合作伙伴 类别下,选择 Merkury,然后选择 设置。
此时会显示 连接到Merkury 页面。 在此页上,您可以使用新凭据或现有凭据。
创建新帐户
如果您正在使用新凭据,请选择 新帐户。 在显示的输入表单上,提供名称、可选描述和您的Merkury凭据。 完成后,选择 连接到源,然后留出一些时间来建立新连接。
使用现有帐户
要使用现有帐户,请选择 现有帐户,然后选择要使用的Merkury帐户。 选择 下一步 以继续。
支持的文件格式
您可以使用Merkury源摄取以下文件格式:
- 分隔符分隔值(DSV):任何单字符值都可以用作DSV格式的数据文件的分隔符。
- JavaScript Object Notation (JSON): JSON格式的数据文件必须符合XDM。
- Apache Parquet: Parquet格式的数据文件必须符合XDM。
- 压缩文件: JSON和分隔文件可以压缩为:
bzip2
、gzip
、deflate
、zipDeflate
、tarGzip
和tar
。
添加数据
创建您的Merkury帐户后,将显示 添加数据 步骤,该步骤为您提供了一个界面,让您能够探索Merkury文件层次结构并选择要带入Experience Platform的文件夹或特定文件。
- 界面的左侧是目录浏览器,显示您的Merkury文件层次结构。
- 界面的右侧部分允许您预览兼容文件夹或文件中最多100行数据。
选择根文件夹以访问您的文件夹层次结构。 在此处,您可以选择单个文件夹以递归方式摄取文件夹中的所有文件。 摄取整个文件夹时,必须确保该文件夹中的所有文件共享相同的数据格式和架构。
选择文件夹后,正确的界面将更新为所选文件夹中第一个文件的内容和结构的预览。
在此步骤中,您可以在继续之前对数据做出多个配置。 首先,选择 数据格式,然后在出现的下拉面板中为文件选择适当的数据格式。
下表显示了所支持文件类型的相应数据格式:
选择列分隔符
配置数据格式后,可在引入分隔文件时设置列分隔符。 选择 分隔符 选项,然后从下拉菜单中选择一个分隔符。 菜单显示最常用的分隔符选项,包括逗号(,
)、制表符(\t
)和管道字符(|
)。
如果您希望使用自定义分隔符,请选择 自定义,然后在弹出输入栏中输入您选择的单个字符分隔符。
摄取压缩文件
您还可以通过指定压缩JSON或分隔文件的压缩类型来摄取它们。
在选择数据步骤中,选择要摄取的压缩文件,然后选择其相应的文件类型以及是否符合XDM。 接下来,选择 压缩类型,然后为您的源数据选择适当的压缩文件类型。
要将特定文件带入Platform,请选择一个文件夹,然后选择要摄取的文件。 在此步骤中,还可以使用文件名旁边的预览图标预览给定文件夹中其他文件的文件内容。
完成后,选择 下一步。
提供数据流详细信息
数据流详细信息页面允许您选择是要使用现有数据集,还是使用新数据集。 在此过程中,您还可以配置要摄取到配置文件的数据,并启用错误诊断、部分摄取和警报等设置。
使用现有数据集
要将数据摄取到现有数据集,请选择 现有数据集。 您可以使用高级搜索选项或通过滚动下拉菜单中的现有数据集列表来检索现有数据集。 选择数据集后,为数据流提供名称和描述。
使用新数据集
要摄取到新数据集中,请选择 新数据集,然后提供输出数据集名称和可选描述。 接下来,使用高级搜索选项或通过滚动下拉菜单中的现有架构列表来选择要映射到的架构。 选择架构后,为数据流提供名称和描述。
启用配置文件和错误诊断
接下来,选择 个人资料数据集 切换开关以启用您的数据集以提供实时客户个人资料。 这允许您创建实体的属性和行为的整体视图。 来自所有启用配置文件的数据集的数据将包含在配置文件中,并在保存数据流时应用更改。
错误诊断允许为数据流中发生的任何错误记录生成详细的错误消息,而部分摄取允许您摄取包含错误的数据,摄取阈值为您手动定义的某个阈值。 有关详细信息,请参阅部分批次摄取概述。
启用警报
您可以启用警报以接收有关数据流状态的通知。 从列表中选择警报以订阅接收有关数据流状态的通知。 有关警报的详细信息,请参阅使用UI订阅源警报指南。
完成向数据流提供详细信息后,选择 下一步。
将数据字段映射到XDM架构
此时将显示映射步骤,该步骤为您提供了一个接口,用于将源架构中的源字段映射到目标架构中相应的目标XDM字段。
Platform根据您选择的目标架构或数据集,为自动映射的字段提供智能推荐。 您可以手动调整映射规则以适合您的用例。 根据需要,您可以选择直接映射字段,或使用数据准备函数转换源数据以派生计算值或计算值。 有关使用映射器界面和计算字段的全面步骤,请参阅数据准备UI指南。
成功映射源数据后,选择 下一步。
计划摄取运行
此时将显示计划步骤,允许您配置摄取计划,以使用配置的映射自动摄取选定的源数据。 默认情况下,计划设置为Once
。 要调整您的摄取频率,请选择 频率,然后从下拉菜单中选择一个选项。
如果将摄取频率设置为Minute
、Hour
、Day
或Week
,则必须设置一个间隔,以便在每次摄取之间建立一个设置的时间范围。 例如,摄取频率设置为Day
,间隔设置为15
意味着您的数据流计划每15天摄取一次数据。
在此步骤中,您还可以启用 回填 并为增量数据摄取定义列。 回填用于摄取历史数据,而您为增量摄取定义的列允许从现有数据中区分新数据。
有关计划配置的详细信息,请参阅下表。
配置频率以指示数据流运行的频率。 您可以将频率设置为:
- 一次:将频率设置为
once
以创建一次性引入。 创建一次性摄取数据流时,间隔和回填配置不可用。 默认情况下,调度频率设置为一次。 - 分钟:将频率设置为
minute
,以计划数据流以每分钟摄取数据。 - 小时:将频率设置为
hour
,以计划数据流每小时摄取数据。 - 天:将频率设置为
day
,以计划数据流每天摄取数据。 - 周:将频率设置为
week
,以计划数据流每周摄取数据。
选择频率后,可以配置间隔设置以建立每次引入之间的时间范围。 例如,如果将频率设置为天并将间隔配置为15,则数据流将每15天运行一次。 不能将间隔设置为零。 每个频率的最小接受间隔值如下:
- 一次:不适用
- 分钟: 15
- 小时: 1
- 天: 1
- 周: 1
完成摄取计划配置后,选择 下一步。
查看您的数据流
将显示 审核 步骤,允许您在创建新数据流之前对其进行审核。 详细信息分为以下类别:
- 连接:显示源类型、所选源文件的相关路径以及该源文件中的列数。
- 分配数据集和映射字段:显示要将源数据摄取到哪个数据集,包括数据集所遵循的架构。
- 计划:显示摄取计划的活动时段、频率和间隔。
查看数据流后,单击 完成 并留出一些时间来创建数据流。
后续步骤
通过完成本教程,您已成功地创建了一个数据流以将批次数据从Merkury源引入Experience Platform。 有关其他资源,请访问下面列出的文档。
监测数据流
创建数据流后,您可以监视通过它摄取的数据,以查看有关摄取率、成功和错误的信息。 有关如何监视数据流的详细信息,请访问有关UI中监视帐户和数据流的教程。
更新您的数据流
要更新数据流计划、映射和常规信息的配置,请访问有关在UI中更新源数据流的教程
删除您的数据流
您可以删除不再必需的数据流或使用 数据流 工作区中提供的 删除 功能错误地创建的数据流。 有关如何删除数据流的详细信息,请访问有关在UI中删除数据流的教程。