資料準備與擷取 Blueprint 涵蓋可在 Adobe Experience Platform 中準備和擷取資料的所有方法。
資料準備包括將來源資料對應至 Experience Data Model (XDM) 方案。它還包括對資料執行轉換,包括資料格式化、欄位拆分 / 聯結 / 轉換以及記錄的接合 / 合併 / 重建按鍵索引。資料準備有助於統一客戶資料以提供彙總 / 篩選的分析,包括為客戶個人資料匯整 / 資料科學 / 啟用報告或準備資料。
下圖說明了將資料擷取至 Adobe Experience Platform 的平均效能護欄和延遲。
串流來源 |
|||
方法 |
常見使用案例 |
通訊協定 |
考量事項 |
|
推播、HTTP、JSON |
|
|
|
推播、REST API、JSON |
|
|
|
推播、REST API、JSON |
|
|
|
推播、來源連接器和 API |
|
|
|
推播、REST API、JSON |
|
|
串流來源 SDK |
|
推播、HTTP API、JSON |
|
批次來源 |
|||
方法 |
常見使用案例 |
通訊協定 |
考量事項 |
|
推播、JSON 或 Parquet |
|
|
|
提取、CSV、JSON、Parquet |
|
|
|
推播、CSV、JSON、Parquet |
— 提供 7 天 TTL 的檔案 |
|
|
提取、REST API、CSV 或 JSON 檔案 |
|
擷取方法 | 說明 |
---|---|
Web/Mobile SDK | 延遲:
|
串流來源 | 串流來源 延遲:
|
串流 API | Edge Network Server API(首選)— 支援邊緣服務,包括邊緣細分和 Data Collection Core Service API — 不支援邊緣服務,直接路由到集線器。 延遲:
|
ETL 工具 | 在擷取到 Experience Platform 之前,使用 ETL 工具修改和轉換企業資料。 延遲:
|
批次來源 | 已排程從來源擷取 延遲:約 200 GB/時 文件 視訊教學課程 |
批次 API | 延遲:
|
Adobe 應用程式連接器 | 自動擷取來自 Adobe Experience Cloud 應用程式的資料 |
資料準備的方法 | 說明 |
---|---|
外部 ETL 工具(Snaplogic、 Mulesoft、 Informatica等) | 在 ETL 工具中執行複雜的轉換,並使用標準 Experience Platform Flow Service API 或來源連接器來擷取結果資料。 |
查詢服務 - 資料準備 | 將連接、分割、合併、轉換、查詢和篩選資料整合為新資料集。使用 Create Table as Select (CTAS) 文件 |
XDM Mapper 與資料準備功能 (串流與批次) | 在 Experience Platform 擷取期間,將 CSV 或 JSON 格式的來源屬性對應至 XDM 屬性。 在資料擷取時計算其功能;即資料格式化、拆分、聯結等。 文件 |