Catalog Service 概觀

Catalog Service是Adobe Experience Platform中資料位置和歷程的記錄系統。 雖然所有擷取至Experience Platform的資料都以檔案和目錄的形式儲存在Data Lake中,但Catalog仍保留這些檔案和目錄的中繼資料和描述,以供查閱和監視。

簡言之,Catalog充當中繼資料存放區或「目錄」,您可在Experience Platform中找到有關您資料的資訊。 您可以使用Catalog來回答下列問題:

  • 我的資料位於何處?
  • 這些資料處於哪個處理階段?
  • 哪些系統或程式對我的資料採取行動?
  • 已成功處理多少資料?
  • 處理期間發生哪些錯誤?

Catalog提供RESTful API,可讓您使用基本CRUD作業以程式設計方式管理Platform中繼資料。 如需詳細資訊,請參閱目錄開發人員指南

Catalog和Experience Platform服務

Catalog Service個追蹤的資源已由多個Experience Platform服務使用。 為了充分利用Catalog’s功能,建議您熟悉這些服務以及它們如何與Catalog互動。

Experience Data Model (XDM)系統

Experience Data Model (XDM)系統是Platform用來組織客戶體驗資料的標準化架構。 Experience Platform運用XDM結構描述,以一致且可重複使用的方式描述資料結構。

將資料內嵌至Platform時,該資料的結構會對映至XDM結構描述,並作為資料集的一部分儲存在Data Lake中。 Catalog Service會追蹤每個資料集的中繼資料,其中包括資料集所符合之XDM結構描述的參考。

如需XDM系統的一般資訊,請參閱XDM系統概覽

Data Ingestion

Experience Platform從多個來源擷取資料,並將記錄儲存為Data Lake內的資料集。 Catalog會追蹤這些資料集的中繼資料,不論資料集的來源或擷取方法為何。

使用批次擷取方法時,Catalog也會追蹤批次檔案的其他中繼資料。 批次是資料單位,由一或多個要作為單一單位內嵌的檔案組成。 Catalog會追蹤這些批次檔案的中繼資料,及其在擷取後持續存在的資料集。 批次中繼資料包含有關成功擷取的記錄數,以及任何失敗記錄和關聯的錯誤訊息的資訊。

如需詳細資訊,請參閱資料擷取概觀

Catalog個物件

如上一節所述,Catalog會追蹤其他Platform服務使用的幾種資源與作業的中繼資料。 Catalog會維護自己封裝此中繼資料的「物件」存放區。 Catalog物件是Platform資料的可查詢表示法,可讓您搜尋、監視和標示您的資料,而不需要存取資料本身。

下表概述Catalog支援的不同物件型別:

物件
API端點
定義
批次
/batches
批次是資料單位,由一或多個要作為單一單位內嵌的檔案組成。 Catalog中的批次物件概述批次的擷取量度(例如處理的記錄數或磁碟大小),也可能包含資料集、檢視和其他受批次作業影響的資源的連結。
資料集
/dataSets
資料集是一種儲存和管理結構,用於收集包含方案(欄)和欄位(列)的資料(通常是表格)。 如需詳細資訊,請參閱資料集總覽
資料集檔案
/datasetFiles
資料集檔案代表儲存在Platform上的資料區塊。 作為常值檔案的記錄,您可以在這裡找到檔案的大小、檔案包含的記錄數,以及對擷取檔案之批次的參照。

後續步驟

本檔案提供Catalog Service的簡介,以及它在Experience Platform較大範圍內的運作方式。 請參閱Catalog 開發人員指南,以瞭解與該Catalog API的不同端點互動的步驟。 建議您參考有關篩選目錄資料的指南,以遵循限制API回應中傳回資料的最佳實務。

recommendation-more-help
c5c02be6-79a3-4a2f-b766-136bffe8b676