資料準備與擷取 Blueprint

資料準備與擷取 Blueprint 涵蓋可在 Adobe Experience Platform 中準備和擷取資料的所有方法。

資料準備包括將來源資料對應至 Experience Data Model (XDM) 方案。它還包括對資料執行轉換,包括資料格式化、欄位拆分 / 聯結 / 轉換以及記錄的接合 / 合併 / 重建按鍵索引。資料準備有助於統一客戶資料以提供彙總 / 篩選的分析,包括為客戶個人資料匯整 / 資料科學 / 啟用報告或準備資料。

架構

資料準備與擷取 Blueprint 的參考架構

資料擷取護欄

下圖說明了將資料擷取至 Adobe Experience Platform 的平均效能護欄和延遲。

Experience Platform 資料流程

資料擷取方法

擷取方法 說明
Web/Mobile SDK 延遲:
  • 即時 - 同頁集合到 Edge 網路
  • 大約 1 分鐘串流擷取到個人資料
  • 串流擷取到資料湖 (微批次約 15 分鐘)
文件:
串流來源 延遲:
  • 即時 - 同頁集合到 Edge 網路
  • 大約 1 分鐘串流擷取到個人資料
  • 串流擷取到資料湖 (微批次約 15 分鐘)
文件
串流 API 延遲:
  • 即時 - 同頁集合到 Edge 網路
  • 大約 1 分鐘串流擷取到個人資料
  • 串流擷取到資料湖 (微批次約 15 分鐘)
  • 7 GB/時
文件
ETL 工具 在擷取到 Experience Platform 之前,使用 ETL 工具修改和轉換企業資料。

延遲:
  • 時間取決於外部 ETL 工具排程,然後基於擷取所用方法套用標準擷取護欄。
批次來源 已排程從來源擷取
延遲:約 200 GB/時

文件
視訊教學課程
批次 API 延遲:
  • 批次擷取到個人資料取決於大小和流量,約 45 分鐘
  • 批次擷取到資料湖取決於大小和流量
文件
Adobe 應用程式連接器 自動擷取來自 Adobe Experience Cloud 應用程式的資料

資料準備方法

資料準備的方法 說明
Data Science Workspace - 資料準備 模型驅動的轉換,指令檔化的轉換。
文件
外部 ETL 工具 (Snaplogic、Mulesoft、Informatica等) 在 ETL 工具中執行複雜的轉換,並使用標準 Experience Platform Flow Service API 或來源連接器來擷取結果資料。
查詢服務 - 資料準備 將連接、分割、合併、轉換、查詢和篩選資料整合為新資料集。使用 Create Table as Select (CTAS)
文件
XDM Mapper 與資料準備功能 (串流與批次) 在 Experience Platform 擷取期間,將 CSV 或 JSON 格式的來源屬性對應至 XDM 屬性。
在資料擷取時計算其功能;即資料格式化、拆分、聯結等。
文件

相關部落格貼文

本頁內容