将数据摄取到Adobe Experience Platform

Adobe Experience Platform允许您轻松将数据导入 Platform 作为批处理文件。 Examples of data to be ingested may include profile data from a flat file in a CRM system (such as a Parquet file) or data that conforms to a known Experience Data Model (XDM) schema in the Schema Registry.

快速入门

In order to complete this tutorial, you must have access to Experience Platform. 如果您在 Experience Platform,请在继续操作之前与系统管理员联系。

如果您希望使用数据摄取API摄取数据,请首先阅读 批量摄取开发人员指南.

数据集工作区

中的数据集工作区 Experience Platform 允许您查看和管理IMS组织创建的所有数据集,并创建新数据集。

通过单击 数据集 的下游。 数据集工作区包含数据集列表,其中包括显示名称、创建时间(日期和时间)、源、架构和上次批处理状态的列,以及上次更新数据集的日期和时间。

注意

单击搜索栏旁边的过滤器图标,以使用过滤功能仅查看为 Profile.

查看所有数据集

创建数据集

要创建数据集,请单击 创建数据集 数据集工作区的右上角。

创建数据集 屏幕,选择是否要从架构创建数据集"或"从CSV文件创建数据集"

在本教程中,将使用一个架构来创建数据集。 单击 从架构创建数据集 继续。

选择数据源

选择数据集架构

On the Select Schema screen, choose a schema by clicking the radio button beside the schema you wish to use. 在本教程中,数据集将使用忠诚度会员架构生成。 使用搜索栏筛选架构是查找要查找的确切架构的一种有用方法。

选择您要使用的架构旁边的单选按钮后,单击 下一个.

选择架构

配置数据集

配置数据集 屏幕上,您将需要为数据集指定一个名称,并且还可能会提供数据集的描述。

Notes on Dataset Names:

  • 数据集名称应该简短且具有描述性,以便以后可以在库中轻松找到该数据集。
  • 数据集名称必须是唯一的,这意味着数据集名称也应足够具体,以便将来不会重复使用。
  • It is best practice to provide additional information about the dataset using the description field, as it may help other users differentiate between datasets in the future.

Once the dataset has a name and description, click Finish.

配置数据集

数据集活动

现在已创建空数据集,并且您已返回到 数据集活动 选项卡。 您应会在工作区的左上角看到数据集的名称,并收到“尚未添加任何批次”通知。 由于您尚未向此数据集添加任何批次,因此应该会出现这种情况。

在数据集工作区的右侧,您将看到 信息 选项卡,其中包含与新数据集相关的信息,如数据集ID、名称、描述、表名、架构、流和源。 “信息”选项卡还包含有关数据集何时创建及其上次修改日期的信息。

“信息”(Info)选项卡中的 用户档案 切换用于启用数据集以供 Real-time Customer Profile. 使用此切换开关,以及 Real-time Customer Profile,将在以下章节中详细说明。

数据集活动

为启用数据集 Real-time Customer Profile

数据集用于将数据摄取到 Experience Platform,并且该数据最终用于识别个人并拼合来自多个来源的信息。 拼合在一起的信息称为 Real-Time Customer Profile. 为 Platform 了解哪些信息应包含在 Real-Time Profile,则可以使用 用户档案 切换。

By default, this toggle is off. 如果选择打开 Profile,则摄取到数据集的所有数据都将用于帮助识别个人并拼合其数据 Real-Time Profile.

详细了解 Real-time Customer Profile 使用身份,请查阅 Identity Service 文档。

为 Real-time Customer Profile,请单击 用户档案信息 选项卡。

配置文件切换

将显示一个对话框,要求您确认是否要为 Real-time Customer Profile.

Enable Profile dialog

单击 启用 切换开关将变为蓝色,表示它已打开。

为配置文件启用

将数据添加到数据集

可以通过多种不同方式将数据添加到数据集。 您可以选择使用 Data Ingestion API或ETL合作伙伴,例如 Unifi 或 Informatica. 在本教程中,将使用 添加数据 选项卡。

要开始向数据集添加数据,请单击 添加数据 选项卡。 您现在可以拖放文件或浏览计算机以查找要添加的文件。

注意

Platform支持两种文件类型(Parquet或JSON)进行数据摄取。 一次最多可以添加五个文件,每个文件的最大文件大小为1 GB。

“添加数据”选项卡

上传文件

拖放(或浏览并选择)要上传的Parquet或JSON文件后, Platform 将立即开始处理文件,并且 上传 对话框将显示在 添加数据 选项卡,其中显示了文件上传的进度。

上传对话框

数据集量度

文件上传完成后, 数据集活动 选项卡不再显示“尚未添加批次”。 相反, 数据集活动 选项卡当前显示数据集量度。 由于尚未加载批处理,因此在此阶段所有量度都将显示“0”。

在选项卡的底部,有一个列表显示 批处理ID 通过 "向数据集添加数据" 进程。 此外,还包含与批相关的信息,包括摄取日期、摄取的记录数和当前批状态。

数据集量度

批次详细信息

单击 批处理ID 查看 批量概述,显示有关该批的其他详细信息。 Once the batch has finished loading, the information about the batch will update to show the number of records ingested and the file size. 状态还将更改为“成功”或“失败”。 如果批处理失败,则 错误代码 部分将包含有关摄取过程中任何错误的详细信息。

有关批量摄取的更多信息和常见问题解答,请参阅 批量摄取疑难解答指南.

返回到 数据集活动 屏幕上,单击数据集的名称(忠诚度详细信息)。

批量概述

预览数据集

数据集准备就绪后,可以选择 预览数据集数据集活动 选项卡。

单击 预览数据集 打开一个对话框,其中显示数据集内的示例数据。 如果数据集是使用架构创建的,则有关数据集架构的详细信息将显示在预览的左侧。 您可以使用箭头展开架构以查看架构结构。 预览数据中的每个列标题都表示数据集中的一个字段。

数据集详细信息

后续步骤和其他资源

现在,您已创建数据集并成功将数据摄取到 Experience Platform,则可以重复这些步骤以创建新数据集或将更多数据摄取到现有数据集。

要了解有关批量摄取的更多信息,请阅读 批量摄取概述 并通过观看下面的视频来补充您的学习。

警告

的 Platform 以下视频中显示的UI已过期。 有关最新的UI屏幕截图和功能,请参阅上述文档。

在此页面上