資料擷取概觀
在Adobe Experience Platform中,資料擷取是將資料從分類來源傳輸到儲存媒體的方式,可供組織存取、使用和分析。 Experience Platform中的資料擷取可以分組為兩個主要類別: 串流擷取 和 批次擷取。
在串流和批次擷取底下,有多種不同的方法可用來將您的資料擷取至Experience Platform。 這些方法包括使用各種 來源 並連線到這些來源,然後將資料帶入Experience Platform。
閱讀本檔案以概略瞭解可將資料內嵌到Experience Platform中的許多不同方式。
串流擷取 streaming
您可以使用串流擷取來即時從使用者端和伺服器端裝置傳送資料至Experience Platform。 Experience Platform支援使用資料輸入來串流傳入的體驗資料,這些資料會儲存在資料湖內已啟用串流的資料集中。 資料輸入可設定為自動驗證其收集的資料,確保資料來自信任的來源。
如需詳細資訊,請閱讀串流擷取總覽。
批次擷取 batch
在Experience Platform中,批次是指一段時間內收集並作為單一單位處理的一組資料。 資料集是由批次組成。 您可以使用批次內嵌將資料以批次檔案的形式內嵌到Experience Platform中。 擷取後,批次會提供中繼資料,說明成功擷取的記錄數,以及任何失敗的記錄和相關的錯誤訊息。
必須使用此方法來內嵌手動上傳的資料檔,例如一般CSV檔案(對應至XDM結構描述)和Parquet檔案。
如需詳細資訊,請閱讀批次擷取總覽。
來源 sources
您也可以連線至Experience Platform來源以內嵌資料。 Experience Platform維護有各種不同資料來源的目錄,供您連結及擷取資料。 這些來源可以是原生Adobe應用程式,例如Adobe Analytics來源或Marketo Engage來源。 您也可以連線到協力廠商來源,例如Amazon S3來源和Google Cloud Storage來源。
來源會分組到不同的類別中,例如雲端儲存空間、資料庫和CRM系統。 指定的來源可能支援批次或串流擷取。
有了來源,您可以從許多不同的資料來源及不同的使用案例類別擷取資料。 此外,透過來源擷取的資料可讓您針對外部資料來源進行驗證、設定擷取排程並管理擷取輸送量。
如需詳細資訊,請閱讀來源概觀以取得更多資訊。
ML輔助結構描述建立 ml-assisted-schema-creation
若要快速整合新資料來源,您現在可以使用機器學習演演算法,從範例資料產生結構描述。 此自動化可簡化建立準確的結構描述、減少錯誤,並加速從資料收集到分析和深入分析的程式。
如需此工作流程的詳細資訊,請參閱ML輔助結構描述建立指南。
資料準備 data-prep
雖然資料準備不是擷取方法,但它是資料擷取流程的重要一環。 在建立資料流以將資料內嵌至Experience Platform之前,請使用資料準備函式對應、轉換及驗證資料與Experience Data Model (XDM)之間的連結。 在資料擷取程式進行期間,「資料準備」會顯示為Experience Platform使用者介面中的「對應」步驟。
如需詳細資訊,請閱讀資料準備總覽。
串流擷取方法 streaming-ingestion-methods
下表概述您可用來將串流資料擷取至Experience Platform的各種方法。
批次擷取方法 batch-ingestion-methods
下表概述您可用來將批次資料擷取至Experience Platform的各種方法。
後續步驟和其他資源
本檔案簡要介紹Experience Platform中Data Ingestion的不同方面。 請繼續閱讀每個擷取方法的概觀檔案,以熟悉其不同的功能、使用案例和最佳實務。 您也可以觀看下方的擷取概觀影片,以補充您的學習。 如需Experience Platform如何追蹤所擷取記錄的中繼資料的詳細資訊,請參閱目錄服務總覽。