資料集總覽
所有成功內嵌至Adobe Experience Platform的資料都會以資料集的形式儲存在Data Lake中。 資料集是資料集合的儲存和管理結構,通常是包含方案 (欄) 和欄位 (列) 的表格。 資料集也包含中繼資料,可說明其儲存資料的各個層面。
本檔案提供Experience Platform中資料集的高階概觀。
建立資料集和追蹤中繼資料
Catalog Service是Experience Platform中資料位置和歷程的記錄系統,用於建立和管理資料集。 Catalog追蹤每個資料集的中繼資料,包括資料集符合的Experience Data Model (XDM)結構描述的參考(下節將加以說明)以及擷取至該資料集的記錄數。
如需詳細資訊,請參閱目錄服務總覽。
強制資料集資料限制
Experience Data Model (XDM)是Platform用來組織客戶體驗資料的標準化架構。 所有內嵌至Platform的資料都必須符合預先定義的XDM結構描述,才能在Data Lake中作為資料集持續存在。
所有資料集都包含XDM架構的參考,這會限制可儲存資料的格式和結構。 嘗試上傳資料到不符合資料集XDM結構的資料集會導致擷取失敗。
如需XDM的詳細資訊,請參閱XDM系統總覽。
將資料擷取至資料集
Adobe Experience Platform資料擷取代表多種方法,Platform可透過這些方法從各種來源擷取資料。 無論擷取方法為何,所有成功擷取的資料都會轉換為批次檔案。 批次是資料單位,由一或多個要作為單一單位內嵌的檔案組成。 然後,這些批次檔案會新增到專用資料集,並儲存在Data Lake中。
如需詳細資訊,請參閱資料擷取概觀。
從結構描述套用到資料集的標籤
Adobe Experience Platform資料控管可讓您管理客戶資料,以確保遵守適用於資料使用的法規、限制和政策。 資料控管架構可讓您套用使用標籤,以根據套用至該資料的使用原則來分類資料。 標籤可套用至個別結構描述、這些結構描述內的欄位以及整個個別資料集。 標籤直接套用至結構描述時,這些標籤會傳播至以該結構描述為基礎的所有現有和未來資料集。
如需服務的詳細資訊,請參閱資料控管概觀。 有關如何使用Platform中使用標籤的步驟,請參閱下列指南:
下游Platform服務中的資料集
一旦資料集已用來儲存所擷取的資料後,下游Platform服務就會使用這些資料集來更新客戶設定檔、透過機器學習取得深入分析等等。
以下是使用資料集進行各種操作的下游服務清單。 如需詳細資訊,請參閱各服務的檔案。
- Data Access API:可讓您存取及下載儲存在資料集中的檔案內容。
- Adobe Experience Platform Identity服務:跨裝置和系統橋接身分,根據資料集所符合的XDM結構描述所定義的身分欄位,將資料集連結在一起。
- Real-Time Customer Profile:運用Identity Service從您的資料集即時建立詳細的客戶設定檔。 Real-Time Customer Profile從Data Lake提取資料,並將客戶設定檔儲存在其自己的獨立資料存放區中。
- Adobe Experience Platform Segmentation Service:可讓您從Real-Time Customer Profile資料建立區段並產生對象。 這些對象就可以匯出到Data Lake中自己的資料集。
- Adobe Experience Platform Data Science Workspace:使用機器學習和人工智慧發掘大型資料集中的深入分析。
- Adobe Experience Platform查詢服務:可讓您使用標準SQL來查詢Experience Platform中的資料,加入Data Lake內的任何資料集,並將查詢結果擷取為新資料集,以用於報表、Data Science Workspace或Real-Time Customer Profile。
- Adobe Experience Platform目的地服務:可讓您匯出資料集至您想要的雲端儲存空間或電子郵件行銷目的地,以用於報表或資料科學活動。
後續步驟
閱讀本檔案後,您已經瞭解Experience Platform中資料集的核心用途,以及使用資料集的各種Platform服務。 如需Platform中資料集使用方式的詳細資訊,請檢閱整份概述中連結的服務檔案。
如需如何與Experience Platform UI中的資料集互動的步驟,請參閱資料集使用手冊。