Adobe Experience Platform允许您轻松地将数据导入 Platform 作为批处理文件。 要引入的数据的示例可能包括CRM系统中平面文件(如Parquet文件)的配置文件数据或与已知数据相符的数据 Experience Data Model 架构注册表中的(XDM)架构。
要完成本教程,您必须拥有 Experience Platform. 如果您无权访问中的组织 Experience Platform,请在继续之前与系统管理员联系。
如果您希望使用数据摄取API来摄取数据,请首先阅读 批量摄取开发人员指南.
中的数据集工作区 Experience Platform 允许您查看和管理组织创建的所有数据集,并创建新数据集。
通过单击查看数据集工作区 数据集 在左侧导航栏中。 数据集工作区包含数据集列表,其中包括显示名称、创建(日期和时间)、源、架构和上次批次状态以及上次更新数据集的日期和时间的列。
单击搜索栏旁的过滤器图标可使用过滤功能仅查看那些启用的数据集 Profile.
要创建数据集,请单击 创建数据集 数据集工作区的右上角。
在 创建数据集 屏幕中,选择是否要“从架构创建数据集“或”从CSV文件创建数据集“。
在本教程中,将使用架构创建数据集。 单击 从架构创建数据集 以继续。
在 选择架构 屏幕上,通过单击要使用的方案旁边的单选按钮来选择方案。 在本教程中,将使用忠诚度成员架构创建数据集。 使用搜索栏筛选架构是一种查找您要查找的确切架构的有用方法。
选中要使用的模式旁边的单选按钮后,单击 下一个.
在 配置数据集 屏幕中,您需要为数据集命名,并且还可以提供数据集的描述。
有关数据集名称的注释:
在数据集具有名称和描述后,单击 完成.
现在已创建一个空数据集,并且您已经返回到 数据集活动 选项卡。 您应该会在工作区的左上角看到数据集的名称,并显示“未添加任何批次”的通知。 这是正常情况,因为您尚未将任何批次添加到此数据集。
在数据集工作区的右侧,您将看到 信息 选项卡,其中包含与新数据集相关的信息,例如数据集ID、名称、描述、表名称、架构、流和源。 信息选项卡还包括有关数据集的创建时间及其上次修改日期的信息。
另外,“信息”选项卡中的 个人资料 用于启用数据集以供使用的切换开关 Real-Time Customer Profile. 使用此切换开关,以及 Real-Time Customer Profile,将在下一节中详细解释。
数据集用于将数据摄取到 Experience Platform,该数据最终用于识别个人并将来自多个来源的信息拼合在一起。 将信息拼合在一起称为 Real-Time Customer Profile. 为了 Platform 了解应包含在 Real-Time Profile,可以使用将数据集标记为包含 个人资料 切换。
默认情况下,此切换处于关闭状态。 如果您选择打开 Profile,则摄取到数据集中的所有数据将用于帮助识别个人并将其 Real-Time Profile.
要了解有关 Real-Time Customer Profile 并使用标识,请查看 Identity Service 文档。
启用数据集 Real-Time Customer Profile,单击 个人资料 切换到 信息 选项卡。
此时将显示一个对话框,要求您确认要为以下项启用数据集 Real-Time Customer Profile.
单击 启用 并且切换将变为蓝色,表示已打开。
可以通过多种不同的方式将数据添加到数据集中。 您可以选择使用 Data Ingestion API或ETL合作伙伴,例如 Unifi 或 Informatica. 在本教程中,将使用将数据添加到数据集 添加数据 选项卡。
要开始将数据添加到数据集,请单击 添加数据 选项卡。 您现在可以拖放文件或浏览计算机以查找要添加的文件。
Platform支持两种文件类型以进行数据摄取:Parquet或JSON。 一次最多可以添加5个文件,每个文件的最大文件大小为1 GB。
拖放(或浏览并选择)要上载的Parquet或JSON文件后, Platform 将立即开始处理该文件并 正在上传 对话框将显示在 添加数据 选项卡中显示文件上传的进度。
文件上传完成后, 数据集活动 选项卡不再显示“未添加任何批次”。 相反, 数据集活动 选项卡现在显示数据集量度。 此时,所有量度都将显示“0”,因为批次尚未加载。
选项卡底部是一个列表,其中显示 批次ID 从以下位置摄取的数据: "将数据添加到数据集" 进程。 还包括与批相关的信息,包括摄取日期、摄取记录数和当前批状态。
单击 批次ID 查看 批次概述,显示有关批次的其他详细信息。 加载完批次后,批次的相关信息将更新以显示摄取的记录数和文件大小。 状态也将更改为“成功”或“失败”。 如果批次失败, 错误代码 部分将包含有关摄取期间出现的任何错误的详细信息。
有关批量摄取的更多信息和常见问题解答,请参阅 批量摄取疑难解答指南.
要返回到 数据集活动 屏幕中,单击数据集的名称(忠诚度详细信息)。
在数据集准备就绪后,可以使用一个选项来 预览数据集 显示在顶部 数据集活动 选项卡。
单击 预览数据集 打开一个对话框,其中显示数据集中的示例数据。 如果数据集是使用架构创建的,则数据集架构的详细信息将显示在预览的左侧。 您可以使用箭头展开架构以查看架构结构。 预览数据中的每个列标题表示数据集中的一个字段。
现在,您已创建一个数据集并成功将数据摄取到 Experience Platform,您可以重复这些步骤以创建新数据集或将更多数据摄取到现有数据集。
要了解有关批量摄取的更多信息,请阅读 批量摄取概述 并通过观看以下视频来补充您的学习。
此 Platform 以下视频中显示的UI已过期。 有关最新的UI屏幕截图和功能,请参阅上述文档。