匯出資料集
本文概述了 Customer Journey Analytics Export datasets 可用來實作下列專案 資料匯出使用案例:
- 資料備份
簡介
匯出資料,使用 Experience Platform Export datasets 可讓您將資料從Customer Journey Analytics資料檢視匯出至任何雲端儲存空間目的地。
詳細資訊
您可以從Experience Platform中的資料湖將原始資料集匯出至雲端儲存目標。 此匯出位於「Experience Platform目的地」術語中,稱為「資料集匯出目的地」。 另請參閱 將資料集匯出至雲端儲存空間目的地 以取得概覽。
支援下列雲端儲存空間目的地:
EXPERIENCE PLATFORMUI
您可以透過Experience Platform UI匯出及排程資料集的匯出。 本節將說明相關步驟。
選取目的地
當您決定要將資料集匯出到的雲端儲存空間目的地時, 選取目的地. 如果您尚未設定偏好雲端儲存空間的目的地,您必須 建立新的目的地連線.
在設定目的地時,您可以定義:
- 檔案型別(JSON或Parquet)、
- 產生的檔案是否應該壓縮,以及
- 是否應該包含資訊清單檔案。
選取資料集
當您選取目的地時,在下一個 選取資料集 您必須從資料集清單中選取資料集的步驟。 如果您已建立多個排程查詢,且希望資料集傳送至相同的雲端儲存空間目的地,則可選取對應的資料集。 另請參閱 選取您的資料集 以取得詳細資訊。
排程資料集匯出
最後,您想要將資料集匯出排程為 正在排程 步驟。 在該步驟中,您可以定義排程,以及資料集匯出是否應為增量式的。 另請參閱 排程資料集匯出 以取得詳細資訊。
最後步驟
檢閱 您的選取範圍並在正確後,開始將資料集匯出至雲端儲存空間目的地。
首先,您必須 驗證 資料匯出成功。 匯出資料集時,Experience Platform會建立一或多個 .json
或 .parquet
存放位置中定義的檔案。 預期會根據您設定的匯出排程,將新檔案儲存在您的儲存位置。 Experience Platform會在您指定為所選目的地一部分的儲存位置中建立資料夾結構,並存放匯出的檔案。 每次匯出時都會建立一個新資料夾,其模式如下: folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
. 預設檔案名稱是隨機產生的,並確保匯出的檔案名稱是唯一的。
流程服務API
或者,您可以使用API匯出及排程資料集的匯出。 相關步驟的記錄於 使用流量服務API匯出資料集.
開始使用
若要匯出資料集,請確定您已 必要許可權. 同時確認您要傳送資料集的目的地支援匯出資料集。 然後,您必須 收集必要和選用標題的值 用於API呼叫的內容。 您也需要 識別目的地的連線規格和流程規格ID 您打算將資料集匯出至。
擷取合格的資料集
您可以 擷取合格資料集的清單 使用,驗證您的資料集是否屬於該清單 GET /connectionSpecs/{id}/configs
API。
建立來源連線
接下來,您必須 建立來源連線 針對您要匯出至雲端儲存空間目的地的資料集(使用其唯一ID)。 您使用 POST /sourceConnections
API。
驗證到目的地(建立基礎連線)
您現在必須 建立基礎連線 使用驗證並安全地儲存認證至您的雲端儲存空間目的地 POST /targetConection
API。
提供匯出引數
接下來,您必須 建立其他目標連線來儲存匯出引數 針對您的資料集,再次使用 POST /targetConection
API。 這些匯出引數包括位置、檔案格式、壓縮等等。
設定資料流
最後,您 設定資料流 以確保您的資料集已使用,匯出至雲端儲存空間目的地 POST /flows
API。 在此步驟中,您可以使用來定義匯出排程 scheduleParams
引數。
驗證資料流
至 檢查資料流的成功執行,使用 GET /runs
API,將資料流ID指定為查詢引數。 此資料流ID是您設定資料流時傳回的識別碼。
驗證 資料匯出成功。 匯出資料集時,Experience Platform會建立一或多個 .json
或 .parquet
存放位置中定義的檔案。 預期會根據您設定的匯出排程,將新檔案儲存在您的儲存位置。 Experience Platform會在您指定為所選目的地一部分的儲存位置中建立資料夾結構,並存放匯出的檔案。 每次匯出時都會建立一個新資料夾,其模式如下: folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
. 預設檔案名稱是隨機產生的,並確保匯出的檔案名稱是唯一的。