在UI中為雲儲存批處理連接器配置資料流

資料流是從源中檢索資料並將資料收錄到資料集的計畫 Platform 任務。 本教學課程提供使用雲端儲存帳戶設定新資料流的步驟。

快速入門

本教學課程需要對Adobe Experience Platform的下列元件有正確的認識:

此外,本教學課程要求您擁有已建立的雲端儲存空間帳戶。 如需在UI中建立不同雲端儲存空間帳戶的教學課程清單,請參閱來源連接 器概觀

支援的檔案格式

Experience Platform 支援從外部儲存中提取的以下檔案格式:

  • 分隔字元分隔值(DSV):目前,對DSV格式化資料檔案的支援僅限於逗號分隔值。 DSV格式檔案中欄位標題的值只能由字母數字字元和下划線組成。 將來將提供對一般DSV檔案的支援。
  • JavaScript Object Notation (JSON):JSON格式的資料檔案必須符合XDM規範。
  • Apache Parquet:拼花格式的資料檔案必須與XDM相容。

選擇資料

在建立雲端儲存帳戶後,會出 現「選取資料 」步驟,提供互動式介面供您探索雲端儲存階層。

  • 介面的左半部分是目錄瀏覽器,顯示伺服器的檔案和目錄。
  • 介面的右半部分可讓您從相容檔案中預覽最多100列資料。

選擇列出的資料夾可讓您將資料夾層次結構遍歷到更深的資料夾中。 在您選取相容的檔案或資料夾後,就會出現「選取資料格式 ​」下拉式清單,您可在其中選擇格式以在預覽視窗中顯示資料。

在預覽視窗填入後,您可以選取「下 一步 」來上傳所選資料夾中的所有檔案。 如果要上傳到特定檔案,請在選擇「下一步」之前,從清單中選擇該 檔案

收錄Parce或JSON檔案

雲端儲存空間帳戶也支援JSON和Parce檔案。 拼花檔案必須與XDM相容,而JSON檔案則不需要與XDM相容。 若要擷取JSON或Parce檔案,請從目錄瀏覽器中選取適當的檔案格式,並從正確的介面套用相容的資料格式。

如果資料格式為JSON,則會顯示預覽,顯示檔案中資料的相關資訊。 在預覽畫面上,您可以使用「XDM相容」下拉式清單來選取JSON是否與 XDM相容

選擇 下一步 ,繼續。

IMPORTANT

與分隔字元和JSON檔案類型不同,Parce格式化的檔案無法預覽。

將資料欄位對應至XDM架構

此時 會顯示 「映射」步驟,提供互動式介面,將來源資料映射至資料 Platform 集。 以Parce格式化的來源檔案必須符合XDM規範,而不需要手動設定對應,而CSV檔案則要求您明確設定對應,但可讓您選擇要對應的來源資料欄位。 JSON檔案(如果標示為XDM問題)不需要手動設定。 但是,如果它未標籤為XDM相容,則需要顯式配置映射。

選擇要接收傳入資料的資料集。 您可以使用現有資料集或建立新資料集。

使用現有資料集

若要將資料內嵌至現有資料集,請選取「 現有資料集」,然後選取資料集圖示。

將出 現「選擇資料集 」對話框。 尋找您要使用的資料集,選取它,然後按一下「繼 」。

使用新資料集

若要將資料新增至新資料集,請選取「 新資料集 」,並在提供的欄位中輸入資料集的名稱和說明。 要添加方案,可以在「選擇方案」對話框中輸入現 有方案 名稱。 或者,您也可以選擇「方 案」高級搜索 ,以搜索適當的方案。

在此步驟中,您可以啟用資料集, Real-time Customer Profile 並建立實體屬性和行為的整體檢視。 所有啟用資料集的資料都將包含在中,並 Profile 在保存資料流時應用更改。

切換描 述檔資料集 按鈕,以啟用您的目標資料集 Profile。

將出 現「選擇模式 」對話框。 選擇要應用於新資料集的模式,然後選擇「完 成」

根據您的需求,您可以選擇直接映射欄位,或使用映射器函式轉換來源資料以衍生計算或計算值。 有關資料映射和映射器函式的詳細資訊,請參閱將CSV資料映 射到XDM模式欄位的教程

對於JSON檔案,除了直接將欄位對應至其他欄位外,您還可將物件直接對應至其他物件和陣列至其他陣列。

請注意,您無法對應不同的類型。 例如,您無法將物件對應至陣列,或欄位對應至物件。

TIP

Platform 根據您選取的目標架構或資料集,為自動映射欄位提供智慧建議。 您可以手動調整對應規則,以符合您的使用案例。

取預覽資料 ,查看從選取資料集中最多100列範例資料的對應結果。

在預覽期間,身分欄會優先化為第一個欄位,因為這是驗證映射結果時所需的關鍵資訊。

映射源資料後,選擇「關 閉」

排程擷取執行

此時 會顯示「排程 」步驟,允許您配置提取計畫,以使用配置的映射自動提取選定的源資料。 下表概述了用於計畫的不同可配置欄位:

欄位 說明
頻率 可選頻率 Once包括 MinuteHourDayWeek
間隔 一個整數,用於設定所選頻率的間隔。
開始時間 UTC時間戳記,指示何時設定進行第一次擷取。
回填 一個布爾值,可決定最初收錄的資料。 如果 啟用回填 ,則指定路徑中的所有目前檔案將在第一次排程擷取期間被擷取。 如果 停用「回填 」,則只會收錄在首次擷取執行和開始時間之間載入的檔案。 在開始時間之前載入的檔案將不會被收錄。

資料流設計為在計畫基礎上自動收錄資料。 從選取擷取頻率開始。 接著,設定間隔,以指定兩個流程執行之間的期間。 間隔的值應為非零整數,且應設定為大於或等於15。

若要設定擷取的開始時間,請調整顯示在開始時間方塊中的日期和時間。 或者,您也可以選取日曆圖示來編輯開始時間值。 開始時間必須大於或等於UTC中的當前時間。

為調度提供值並選擇「下 一步」。

設定一次性提取資料流

若要設定一次性擷取,請選取頻率下拉箭頭,然後選取「 Once」。 只要開始時間未來,您就可以繼續編輯資料流集以進行一次頻率接收。 一旦開始時間過去,就無法再編輯一次頻率值。

TIP

在單 次擷取期間 ​,不會顯示間隔和回填。

在為計畫提供適當值後,選擇「下 一步」

提供資料流詳細資訊

此時將顯示 資料流詳細資訊 ,允許您命名新資料流並提供有關新資料流的簡要說明。

在此過程中,您還可以啟用「部 分提取 」和「 錯誤診斷」。 啟用 部分擷取 ,可讓您擷取包含錯誤的資料,最多可設定特定臨界值。 啟用 錯誤診斷 ,將提供任何個別批次錯誤資料的詳細資訊。 如需詳細資訊,請參閱部 分批次擷取概觀

為資料流提供值並選擇「下 一步」。

查看資料流

此時 會出現 「查看」步驟,允許您在建立新資料流之前對其進行查看。 詳細資訊會分組在下列類別中:

  • 連接:顯示源檔案的類型、所選源檔案的相關路徑,以及該源檔案中的列數。
  • 指派資料集與地圖欄位:顯示源資料被吸收到的資料集,包括資料集所附的模式。
  • 排程:顯示接收調度的活動期間、頻率和間隔。

複查資料流後,按一下 完成 ,並為建立資料流留出一些時間。

監控資料流

建立資料流後,您可以監視通過其獲取的資料,以查看有關提取率、成功和錯誤的資訊。 有關如何監視資料流的詳細資訊,請參見UI中有關監 視帳戶和資料流的教程

刪除資料流

您可以使用「資料流」工作區中的「刪除」功能刪除不再需要或 建立錯誤的 資料流 ​。 有關如何刪除資料流的詳細資訊,請參見UI中有關 刪除資料流的教程

後續步驟

在本教程中,您成功建立了一個資料流,以便從外部雲儲存中導入資料,並獲得了對監控資料集的深入瞭解。 若要進一步瞭解建立資料流,您可以觀賞以下視訊來補充學習內容。 此外,下游服務(例如和)現在可以 Platform 使用傳入 Real-time Customer Profile 的資料 Data Science Workspace。 如需詳細資訊,請參閱下列檔案:

WARNING

下 Platform 列視訊中顯示的UI已過時。 請參閱上述檔案以取得最新的UI螢幕擷取和功能。

附錄

以下各節提供了使用源連接器的附加資訊。

禁用資料流

建立資料流時,它會立即變為活動狀態,並根據給定的時間表收集資料。 您可以隨時按照以下說明禁用活動資料流。

在「來源 」工作 區中,按一下「 瀏覽 」標籤。 接著,按一下與要禁用的活動資料流關聯的帳戶的名稱。

此時將 顯示「源 」活動頁。 從清單中選擇活動資料流,以在螢幕右側開啟其 Properties (屬性)列,該列包含 ​Enabled(啟用)切換按鈕。 按一下切換以禁用資料流。 在禁用資料流後,可以使用相同的切換來重新啟用資料流。

啟用傳入的人口資 Profile 料

來自來源連接器的傳入資料可用於豐富和填入資 Real-time Customer Profile 料。 如需填入資料的詳細資 Real-time Customer Profile 訊,請參閱描述檔填 入教學課程

本頁內容