将数据摄取到Adobe Experience Platform
Adobe Experience Platform允许您将数据作为批处理文件轻松导入Platform。 要摄取的数据的示例可能包括CRM系统中平面文件(如Parquet文件)的配置文件数据,或与架构注册表中的已知Experience Data Model (XDM)架构相符的数据。
快速入门
要完成本教程,您必须拥有Experience Platform的访问权限。 如果您无权访问Experience Platform中的组织,请在继续之前与系统管理员交谈。
如果您希望使用数据摄取API来摄取数据,请先阅读批量摄取开发人员指南。
数据集工作区
Experience Platform中的数据集工作区允许您查看和管理组织创建的所有数据集,以及创建新数据集。
通过单击左侧导航中的 数据集 查看数据集工作区。 数据集工作区包含数据集列表,其中包括显示名称、创建(日期和时间)、源、架构和上次批次状态以及上次更新数据集的日期和时间的列。
创建数据集
要创建数据集,请单击数据集工作区右上角的 创建数据集。
在 创建数据集 屏幕上,选择是要“从架构创建数据集”还是“从CSV文件创建数据集”。
在本教程中,将使用架构创建数据集。 单击 从架构 创建数据集以继续。
选择数据集架构
在 选择架构 屏幕上,通过单击要使用的架构旁边的单选按钮来选择架构。 在本教程中,将使用忠诚度成员架构创建数据集。 使用搜索栏筛选架构是一种查找要查找的确切架构的有用方法。
选择了要使用的架构旁边的单选按钮后,单击 下一步。
配置数据集
在 配置数据集 屏幕上,您需要为数据集提供一个名称,并且还可以提供数据集的描述。
有关数据集名称的注释:
- 数据集名称应简短且具有描述性,以便之后能够在库中轻松找到数据集。
- 数据集名称必须是唯一的,这意味着它还应该足够具体,以便将来不会重复使用。
- 最佳实践是使用描述字段提供有关数据集的附加信息,因为它可能有助于其他用户将来区分数据集。
在数据集具有名称和描述后,单击 完成。
数据集活动
现在已创建一个空数据集,并且您已经返回到数据集工作区中的 数据集活动 选项卡。 您应该会在工作区的左上角看到数据集的名称,同时还会看到“未添加任何批次”的通知。 这是正常情况,因为您尚未将任何批次添加到此数据集。
在数据集工作区的右侧,您会看到 信息 选项卡,其中包含与新数据集相关的信息,例如数据集ID、名称、描述、表名称、架构、流和源。 信息选项卡还包括有关数据集的创建时间及其上次修改日期的信息。
在“信息”选项卡中还有 配置文件 切换开关,用于启用您的数据集以与Real-Time Customer Profile一起使用。 此切换及Real-Time Customer Profile的使用将在下一节中详细说明。
为Real-Time Customer Profile启用数据集
数据集用于将数据摄取到Experience Platform,该数据最终用于识别个人并将来自多个来源的信息拼合在一起。 将信息拼合在一起称为Real-Time Customer Profile。 为了让Platform知道哪些信息应包含在Real-Time Profile中,可以使用 配置文件 切换将数据集标记为包含。
默认情况下,此切换处于关闭状态。 如果您选择打开Profile,则摄取到数据集中的所有数据将用于帮助识别个人并将他们的Real-Time Profile拼合在一起。
要了解有关Real-Time Customer Profile和使用身份的详细信息,请查阅身份服务文档。
要为Real-Time Customer Profile启用数据集,请单击 信息 选项卡中的 配置文件 切换开关。
将出现一个对话框,要求您确认要为Real-Time Customer Profile启用数据集。
单击“启用”,切换将变为蓝色,表示已打开。
已为配置文件 启用
将数据添加到数据集
可以通过多种不同的方式将数据添加到数据集中。 您可以选择使用Data Ingestion API或ETL合作伙伴,如Unifi或Informatica。 在本教程中,将使用UI中的 添加数据 选项卡将数据添加到数据集。
要开始将数据添加到数据集,请单击 添加数据 选项卡。 您现在可以拖放文件或浏览计算机以查找要添加的文件。
上传文件 upload-file
拖放(或浏览并选择)要上载的Parquet或JSON文件后,Platform将立即开始处理该文件,并且 添加数据 选项卡上将显示一个 上载 对话框,显示文件上载的进度。
数据集量度
文件上传完成后,数据集活动 选项卡不再显示“未添加批次”。 相反,数据集活动 选项卡现在显示数据集量度。 此时,所有量度都将显示“0”,因为批次尚未加载。
选项卡的底部是一个列表,其中显示刚通过“将数据添加到数据集”进程摄取的数据的 批次ID。 另外,还包括与批相关的信息,包括摄取日期、摄取记录数和当前批状态。
批次详细信息
单击 批次ID 可查看 批次概述,其中包含有关批次的其他详细信息。 加载完批次后,批次的相关信息将更新,以显示摄取的记录数和文件大小。 状态还将更改为“成功”或“失败”。 如果批次失败,则 错误代码 部分将包含有关摄取期间出现的任何错误的详细信息。
有关批次摄取的更多信息和常见问题,请参阅批次摄取疑难解答指南。
要返回 数据集活动 屏幕,请在痕迹导航中单击数据集的名称(忠诚度详细信息)。
预览数据集
数据集准备就绪后,数据集活动 选项卡顶部将显示 预览数据集 的选项。
单击 预览数据集 可打开一个对话框,其中显示了数据集中的示例数据。 如果数据集是使用架构创建的,则数据集架构的详细信息将显示在预览的左侧。 您可以使用箭头展开架构以查看架构结构。 预览数据中的每个列标题表示数据集中的一个字段。
后续步骤和其他资源
现在,您已创建一个数据集并成功将数据摄取到Experience Platform,您可以重复这些步骤以创建新数据集或将更多数据摄取到现有数据集。
要了解有关批次摄取的更多信息,请阅读批次摄取概述,并通过观看以下视频来补充您的学习。