Catalog Service 概觀

Catalog Service是Adobe Experience Platform中資料位置和歷程的記錄系統。 雖然所有擷取至Experience Platform的資料都以檔案和目錄的形式儲存在Data Lake中,但Catalog仍保留這些檔案和目錄的中繼資料和描述,以供查閱和監視。

簡言之,Catalog充當中繼資料存放區或「目錄」,您可在Experience Platform中找到有關您資料的資訊。 您可以使用Catalog來回答下列問題:

  • 我的資料位於何處?
  • 這些資料處於哪個處理階段?
  • 哪些系統或程式對我的資料採取行動?
  • 已成功處理多少資料?
  • 處理期間發生哪些錯誤?

Catalog提供RESTful API,可讓您使用基本CRUD作業以程式設計方式管理Experience Platform中繼資料。 如需詳細資訊,請參閱目錄開發人員指南

Catalog和Experience Platform服務

Catalog Service個追蹤的資源已由多個Experience Platform服務使用。 為了充分利用Catalog’s功能,建議您熟悉這些服務以及它們如何與Catalog互動。

Experience Data Model (XDM)系統

Experience Data Model (XDM)系統是Experience Platform用來組織客戶體驗資料的標準化架構。 Experience Platform運用XDM結構描述,以一致且可重複使用的方式描述資料結構。

將資料內嵌至Experience Platform時,該資料的結構會對映至XDM結構描述,並作為資料集的一部分儲存在Data Lake中。 Catalog Service會追蹤每個資料集的中繼資料,其中包括資料集所符合之XDM結構描述的參考。

如需XDM系統的一般資訊,請參閱XDM系統概覽

Data Ingestion

Experience Platform從多個來源擷取資料,並將記錄儲存為Data Lake內的資料集。 Catalog會追蹤這些資料集的中繼資料,不論資料集的來源或擷取方法為何。

使用批次擷取方法時,Catalog也會追蹤批次檔案的其他中繼資料。 批次是資料單位,由一或多個要作為單一單位內嵌的檔案組成。 Catalog會追蹤這些批次檔案的中繼資料,及其在擷取後持續存在的資料集。 批次中繼資料包含有關成功擷取的記錄數,以及任何失敗記錄和關聯的錯誤訊息的資訊。

如需詳細資訊,請參閱資料擷取概觀

Catalog個物件

如上一節所述,Catalog會追蹤其他Experience Platform服務使用的幾種資源與作業的中繼資料。 Catalog會維護自己封裝此中繼資料的「物件」存放區。 Catalog物件是Experience Platform資料的可查詢表示法,可讓您搜尋、監視和標示您的資料,而不需要存取資料本身。

下表概述Catalog支援的不同物件型別:

物件
API端點
定義
批次
/batches
批次是資料單位,由一或多個要作為單一單位內嵌的檔案組成。 Catalog中的批次物件概述批次的擷取量度(例如處理的記錄數或磁碟大小),也可能包含資料集、檢視和其他受批次作業影響的資源的連結。
資料集
/dataSets
資料集是一種儲存和管理結構,用於收集包含方案(欄)和欄位(列)的資料(通常是表格)。 如需詳細資訊,請參閱資料集總覽
資料集檔案
/datasetFiles
資料集檔案代表儲存在Experience Platform上的資料區塊。 作為常值檔案的記錄,您可以在這裡找到檔案的大小、檔案包含的記錄數,以及對擷取檔案之批次的參照。

後續步驟

本檔案提供Catalog Service的簡介,以及它在Experience Platform較大範圍內的運作方式。 請參閱Catalog 開發人員指南,以瞭解與該Catalog API的不同端點互動的步驟。 建議您參考有關篩選目錄資料的指南,以遵循限制API回應中傳回資料的最佳實務。

recommendation-more-help
c5c02be6-79a3-4a2f-b766-136bffe8b676