Catalog Service 概述

Last update: Fri Apr 04 2025 00:00:00 GMT+0000 (Coordinated Universal Time)

创建对象：

Catalog Service是Adobe Experience Platform中数据位置和族系的记录系统。虽然所有被摄取到Experience Platform的数据都作为文件和目录存储在Data Lake中，但Catalog保留这些文件和目录的元数据和描述，以便进行查找和监视。

简而言之，Catalog充当元数据存储或“目录”，您可以在其中查找Experience Platform中有关您的数据的信息。您可以使用Catalog回答以下问题：

Catalog提供了一个RESTful API，允许您使用基本CRUD操作以编程方式管理Experience Platform元数据。有关详细信息，请参阅目录开发人员指南。

Catalog和Experience Platform服务

Catalog Service跟踪的资源由多个Experience Platform服务使用。为了充分利用Catalog’s功能，建议您熟悉这些服务以及它们如何与Catalog交互。

Experience Data Model (XDM)系统是Experience Platform用于组织客户体验数据的标准化框架。 Experience Platform利用XDM架构以一致且可重用的方式描述数据结构。

将数据摄取到Experience Platform中时，该数据的结构将映射到XDM架构并作为数据集的一部分存储在Data Lake中。 Catalog Service跟踪每个数据集的元数据，包括对该数据集所遵循的XDM架构的引用。

有关XDM系统的更多常规信息，请参阅XDM系统概述。

Experience Platform从多个源摄取数据，并将记录作为Data Lake中的数据集保留。 Catalog跟踪这些数据集的元数据，无论其源或摄取方法如何。

使用批处理摄取方法时，Catalog还会跟踪批处理文件的其他元数据。批量是由一个或多个要作为单个单位摄取的文件组成的数据单位。 Catalog跟踪这些批处理文件的元数据，以及摄取后它们保留的数据集。批次元数据包括有关成功摄取的记录数的信息，以及任何失败记录和关联的错误消息。

有关详细信息，请参阅数据引入概述。

如上一节所述，Catalog跟踪其他Experience Platform服务使用的多种资源和操作的元数据。 Catalog保留其自己封装此元数据的“对象”存储。 Catalog对象是Experience Platform数据的可查询表示形式，允许您搜索、监视和标记数据而无需访问数据本身。

下表概述了Catalog支持的不同对象类型：

对象

API端点

定义

批次

/batches

批量是由一个或多个要作为单个单位摄取的文件组成的数据单位。 Catalog中的批次对象概述了批次的摄取量度（例如处理的记录数或磁盘大小），并且可能还包括到受批次操作影响的数据集、视图和其他资源的链接。

数据集

/dataSets

数据集是用于收集数据的存储和管理结构（通常是表），其中包含架构（列）和字段（行）。有关详细信息，请参阅数据集概述。

数据集文件

/datasetFiles

数据集文件表示已在Experience Platform上保存的数据块。作为文本文件的记录，您可以从中找到文件的大小、包含的记录数以及对摄取文件的批次的引用。

本文档介绍了Catalog Service以及它如何在Experience Platform的较大范围内工作。有关与该Catalog API的不同端点进行交互的步骤，请参阅Catalog 开发人员指南。建议您同时参阅关于筛选目录数据的指南，以便遵循限制API响应中返回的数据的最佳实践。

recommendation-more-help

c5c02be6-79a3-4a2f-b766-136bffe8b676