Catalog Service是Adobe Experience Platform中数据位置和族系的记录系统。 虽然所有被摄取到Experience Platform的数据都作为文件和目录存储在Data Lake中,但Catalog保留这些文件和目录的元数据和描述,以便进行查找和监视。
简而言之,Catalog充当元数据存储或“目录”,您可以在其中查找Experience Platform中有关您的数据的信息。 您可以使用Catalog回答以下问题:
Catalog提供了一个RESTful API,允许您使用基本CRUD操作以编程方式管理Experience Platform元数据。 有关详细信息,请参阅目录开发人员指南。
Catalog Service跟踪的资源由多个Experience Platform服务使用。 为了充分利用Catalog’s功能,建议您熟悉这些服务以及它们如何与Catalog交互。
Experience Data Model (XDM)系统
Experience Data Model (XDM)系统是Experience Platform用于组织客户体验数据的标准化框架。 Experience Platform利用XDM架构以一致且可重用的方式描述数据结构。
将数据摄取到Experience Platform中时,该数据的结构将映射到XDM架构并作为数据集的一部分存储在Data Lake中。 Catalog Service跟踪每个数据集的元数据,包括对该数据集所遵循的XDM架构的引用。
有关XDM系统的更多常规信息,请参阅XDM系统概述。
Data Ingestion
Experience Platform从多个源摄取数据,并将记录作为Data Lake中的数据集保留。 Catalog跟踪这些数据集的元数据,无论其源或摄取方法如何。
使用批处理摄取方法时,Catalog还会跟踪批处理文件的其他元数据。 批量是由一个或多个要作为单个单位摄取的文件组成的数据单位。 Catalog跟踪这些批处理文件的元数据,以及摄取后它们保留的数据集。 批次元数据包括有关成功摄取的记录数的信息,以及任何失败记录和关联的错误消息。
有关详细信息,请参阅数据引入概述。
Catalog对象
如上一节所述,Catalog跟踪其他Experience Platform服务使用的多种资源和操作的元数据。 Catalog保留其自己封装此元数据的“对象”存储。 Catalog对象是Experience Platform数据的可查询表示形式,允许您搜索、监视和标记数据而无需访问数据本身。
下表概述了Catalog支持的不同对象类型: