数据集概述

成功引入Adobe Experience Platform的所有数据将作为数据集保留在Data Lake中。 数据集是存储和管理构建,用于模式集合,通常是表格,其中包含(列)和字段(行)。 数据集还包含描述其存储数据各个方面的元数据。

此文档提供Experience Platform中数据集的高级概述。

创建数据集和跟踪元数据

Catalog Service 是记录数据位置和谱系的系统, Experience Platform用于创建和管理数据集。Catalog 跟踪每个数据集的元数据,包括对数据集符合的( Experience Data Model XDM)模式的引用(在下一节中说明)以及摄取到该数据集中的记录数。

有关详细信息,请参阅目录服务概述

对数据集数据实施约束

Experience Data Model (XDM)是组织客户体验数据 Platform 的标准化框架。所有被收录到Platform中的模式必须符合预定义的XDM数据,才能在Data Lake中作为数据集进行保留。

所有数据集都包含对XDM模式的引用,该引用限制了可以存储的数据的格式和结构。 尝试将数据上传到不符合数据集的XDM模式的数据集将导致摄取失败。

有关XDM的详细信息,请参阅XDM系统概述

将数据引入数据集

Adobe Experience Platform数据摄取表示Platform从各种源中摄取数据的多种方法。 无论采用何种摄取方法,所有成功摄取的数据都将转换为批处理文件。 批量是由一个或多个要作为单个单位摄取的文件组成的数据单位。然后,这些批处理文件将添加到专用数据集并保留在Data Lake中。

有关详细信息,请参阅数据摄取概述

将使用标签应用于数据集

Adobe Experience Platform Data Governance允许您管理客户数据,以确保符合适用于数据使用的法规、限制和政策。 Data Governance框架允许您应用使用标签以根据应用于该数据的使用策略对数据进行分类。

数据使用标签可以应用于整个数据集或单个数据集字段。 在数据集级别添加的标签由该数据集中的所有字段继承。

有关该服务的详细信息,请参阅数据治理概述。 有关如何使用Platform中的使用标签的步骤,请参阅以下指南:

下游Platform服务中的数据集

使用数据集存储摄取的数据后,下游Platform服务会使用这些数据集更新客户用户档案、通过机器学习获得洞察等。

以下是使用数据集进行各种操作的下游服务列表。 有关更多信息,请查看每项服务的文档。

后续步骤

通过阅读此文档,您已被引入Experience Platform中数据集的核心使用以及利用数据集的各种Platform服务。 有关Platform中使用数据集的多种方式的详细信息,请查看本概述中链接的服务文档。

有关如何与Experience Platform UI中的数据集交互的步骤,请参阅数据集用户指南

On this page