在UI中使用資料庫來源建立資料流
資料流是排程的工作,可擷取來源中的資料並將資料擷取到Adobe Experience Platform中的資料集。 本教學課程提供如何使用Experience Platform UI為資料庫來源建立資料流的步驟。
-
為了建立資料流,您必須擁有具有資料庫來源的已驗證帳戶。 在UI中建立不同資料庫來源帳戶的教學課程清單可在來源概觀中找到。
-
為了讓Experience Platform擷取資料,所有表格型批次來源的時區都必須設定為UTC。 Snowflake 來源唯一支援的時間戳記是UTC時間的TIMESTAMP_NTZ。
快速入門
本教學課程需要您實際瞭解下列Experience Platform元件:
-
來源: Experience Platform允許從各種來源擷取資料,同時讓您能夠使用Experience Platform服務來建構、加標籤以及增強傳入的資料。
-
Experience Data Model (XDM) 系統: Experience Platform用來組織客戶體驗資料的標準化架構。
- 結構描述組合的基本概念:瞭解XDM結構描述的基本建置區塊,包括結構描述組合中的關鍵原則和最佳實務。
- 結構描述編輯器教學課程:瞭解如何使用結構描述編輯器使用者介面建立自訂結構描述。
-
Real-Time Customer Profile:根據來自多個來源的彙總資料,提供統一的即時消費者設定檔。
-
Data Prep:允許資料工程師對應、轉換及驗證與Experience資料模型(XDM)之間的資料。
新增資料
建立資料庫來源帳戶之後,會顯示 Add data 步驟,提供介面供您探索資料庫來源帳戶的表格階層。
- 介面的左半部分是瀏覽器,顯示帳戶中包含的資料表清單。 介面也包含搜尋選項,可讓您快速識別要使用的來源資料。
- 介面的右半部分是預覽面板,可讓您預覽最多100列的資料。
找到來源資料後,請選取資料表,然後選取Next。
提供資料流詳細資訊
Dataflow detail頁面可讓您選取您要使用現有的資料集還是新的資料集。 在此程式中,您也可以設定Profile dataset、Error diagnostics、Partial ingestion和Alerts的設定。
使用現有的資料集
若要將資料內嵌至現有的資料集,請選取Existing dataset。 您可以使用Advanced search選項或捲動下拉式選單中的現有資料集清單,來擷取現有資料集。 選取資料集後,請為資料流提供名稱和說明。
使用新資料集
若要擷取至新的資料集,請選取New dataset,然後提供輸出資料集名稱和選用的說明。 接下來,使用Advanced search選項或捲動下拉式選單中的現有結構描述清單,選取要對應的結構描述。 選取結構描述後,請為資料流提供名稱和說明。
啟用Profile和錯誤診斷
接著,選取 Profile dataset 切換以啟用Profile的資料集。 這可讓您建立實體屬性和行為的整體檢視。 來自所有已啟用Profile的資料集的資料將包含在Profile中,而變更會在您儲存資料流時套用。
Error diagnostics可針對資料流中發生的任何錯誤記錄產生詳細的錯誤訊息,而Partial ingestion可讓您內嵌包含錯誤的資料,最多可達您手動定義的特定臨界值。 如需詳細資訊,請參閱部分批次擷取總覽。
啟用警示
您可以啟用警報以接收有關資料流狀態的通知。 從清單中選取警報以訂閱接收有關資料流狀態的通知。 如需警示的詳細資訊,請參閱使用UI訂閱來源警示的指南。
當您完成提供詳細資料給資料流時,請選取Next。
將資料欄位對應至XDM結構描述
Mapping步驟隨即顯示,為您提供介面,用於將來源結構描述中的來源欄位對應到目標結構描述中適當的目標XDM欄位。
Experience Platform會根據您選取的目標結構或資料集,為自動對應的欄位提供智慧型建議。 您可以手動調整對應規則以符合您的使用案例。 您可以根據自己的需求,選擇直接對應欄位,或使用資料準備函式來轉換來源資料,以衍生計算或計算的值。 如需使用對應程式介面和計算欄位的完整步驟,請參閱資料準備UI指南。
控制項資料行(例如_change_request_type)用於變更資料擷取,會在擷取期間讀取,但不會儲存在目標結構描述中。
關聯式結構描述也支援使用主索引鍵和外部索引鍵對應的資料集之間的關係。
如需詳細資訊,請參閱Data Mirror概觀和關聯式結構描述技術參考。
成功對應來源資料後,請選取Next。
排程內嵌執行
Scheduling步驟會出現,允許您設定擷取排程,以使用設定的對應自動擷取所選的來源資料。 根據預設,排程設定為Once。 若要調整您的擷取頻率,請選取Frequency,然後從下拉式選單中選取選項。
如果您將擷取頻率設為Minute、Hour、Day或Week,則必須設定間隔,以在每次擷取之間建立設定的時間範圍。 例如,擷取頻率設為Day,而間隔設為15,表示您的資料流已排程每15天擷取一次資料。
在此步驟中,您也可以啟用回填,並定義資料增量擷取的資料行。 回填是用來擷取歷史資料,而您為增量擷取定義的欄則可區分新資料與現有資料。
請參閱下表以取得排程設定的詳細資訊。
設定頻率以指出資料流執行的頻率。 您可以將頻率設為:
- 一次:將您的頻率設定為
once以建立一次性內嵌。 建立一次性擷取資料流時,無法使用間隔和回填的設定。 依預設,排程頻率會設定為一次。 - 分鐘:將頻率設為
minute,排程您的資料流以每分鐘擷取資料。 - 小時:將頻率設為
hour,排程您的資料流以每小時為基礎擷取資料。 - 天:將您的頻率設為
day,排程您的資料流每天擷取資料。 - 周:將頻率設為
week,排程您的資料流每週擷取資料。 如需詳細資訊,請閱讀[瞭解每週擷取排程] (#weekly)一節。
選取頻率後,您就可以設定間隔設定,以建立每次擷取之間的時間範圍。 例如,如果您將頻率設為「天」,並將間隔設為15,則您的資料流將每隔15天執行一次。 您不能將間隔設定為零。 每個頻率的最小接受間隔值如下:
- 一次:不適用
- 分鐘: 15
- 小時: 1
- 天: 1
- 周: 1
瞭解每週擷取排程 weekly
當您選擇將資料流設定為每週排程執行時,資料流將根據以下其中一種情況執行:
- 如果您的資料來源已建立,但尚未擷取任何資料,則第一個每週資料流將在來源建立日期後7天執行。 此7天間隔一律從來源建立時開始,無論您何時設定排程。 初次執行後,資料流將根據設定的排程繼續每週執行。
- 如果來源中的資料先前已擷取,而您又排程每週擷取,則下一個資料流將在最近一次成功擷取後7天執行。
檢閱您的資料流
Review步驟隨即顯示,可讓您在建立新資料流之前先檢閱該資料流。 詳細資料會分組到以下類別中:
- Connection:顯示來源型別、所選來源檔案的相關路徑,以及該來源檔案中的欄數。
- Assign dataset & map fields:顯示要擷取來源資料的資料集以及相關結構描述。 如果您使用關聯式結構描述,請確認必填欄位(例如主索引鍵和版本識別碼)已正確對應。 此外,請確定已正確設定任何變更資料擷取控制欄。 使用關聯式結構描述的資料集支援多個資料模型,並啟用變更資料擷取工作流程。
- Scheduling:顯示內嵌排程的有效期間、頻率和間隔。
檢閱您的資料流後,請選取「Finish」並允許一段時間以建立資料流。
監視資料流
建立資料流後,您可以監視透過該資料流擷取的資料,以檢視擷取率、成功和錯誤的資訊。 如需有關如何監視資料流的詳細資訊,請參閱有關UI中監視帳戶和資料流的教學課程。
刪除您的資料流
您可以刪除不再需要的資料流,或是使用 Delete 工作區中可用的 Dataflows 功能錯誤建立的資料流。 如需有關如何刪除資料流程的詳細資訊,請參閱有關在UI中刪除資料流程的教學課程。
後續步驟
依照本教學課程中的指示,您已成功建立資料流,以將資料從您的資料庫來源帶入Experience Platform。 下游Experience Platform服務(例如Real-Time Customer Profile和Data Science Workspace)現在可以使用內送資料。 如需更多詳細資訊,請參閱下列檔案: