数据集概述

成功摄取到Adobe Experience Platform的所有数据都将保留在 Data Lake 作为数据集。 数据集是用于数据集合的存储和管理结构,通常是表格,其中包含架构(列)和字段(行)。数据集还包含描述其存储数据各个方面的元数据。

本文档提供了 Experience Platform.

创建数据集和跟踪元数据

Catalog Service 是中数据位置和谱系的记录系统 Experience Platform、和用于创建和管理数据集。 Catalog 跟踪每个数据集的元数据,其中包括对 Experience Data Model (XDM)数据集符合的模式(在下一节中有说明)以及摄取到该数据集中的记录数。

请参阅 目录服务概述 以了解更多信息。

对数据集数据实施限制

Experience Data Model (XDM)是标准化框架, Platform 组织客户体验数据。 所有摄取到 Platform 必须符合预定义的XDM架构,才能将其持久保留在 Data Lake 作为数据集。

所有数据集都包含对XDM架构的引用,该架构可限制可存储数据的格式和结构。 如果尝试将数据上传到与数据集的XDM架构不符的数据集,则会导致摄取失败。

有关XDM的更多信息,请参阅 XDM系统概述.

将数据摄取到数据集

Adobe Experience Platform数据摄取表示通过 Platform 从各种源摄取数据。 无论采用何种摄取方法,所有成功摄取的数据都会转换为批处理文件。 批量是由一个或多个要作为单个单位摄取的文件组成的数据单位。然后,这些批处理文件会添加到专用数据集并保留在 Data Lake.

请参阅 数据摄取概述 以了解更多信息。

将使用情况标签应用于数据集

Adobe Experience Platform数据管理允许您管理客户数据,以确保遵守适用于数据使用的法规、限制和政策。 数据管理框架允许您应用使用标签,以根据应用于该数据的使用策略对数据进行分类。

数据使用情况标签可以应用于整个数据集或单个数据集字段。 数据集级别添加的标签将由该数据集内的所有字段继承。

请参阅 数据管理概述 以了解有关该服务的详细信息。 有关如何使用 Platform,请参阅以下指南:

下游数据集 Platform 服务

使用数据集存储摄取的数据后,下游会使用这些数据集 Platform 更新客户配置文件、通过机器学习获得洞察等服务。

以下是使用数据集进行各种操作的下游服务列表。 有关更多信息,请查看每项服务的文档。

后续步骤

通过阅读本文档,您已介绍中数据集的核心用法 Experience Platform,以及 Platform 利用数据集的服务。 有关中使用数据集的多种方式的更多详细信息 Platform,请查看在此概述中链接的服务文档。

有关如何与 Experience Platform UI,请参阅 datasets用户指南.

在此页面上