將資料集匯出至雲端儲存空間目的地
- 已購買Real-Time CDP Prime或Ultimate套件、Adobe Journey Optimizer或Customer Journey Analytics的客戶可使用此功能。 如需詳細資訊,請聯絡您的Adobe代表。
本文會說明匯出所需的工作流程 資料集 從Adobe Experience Platform到您偏好的雲端儲存位置,例如 Amazon S3、 SFTP位置或 Google Cloud Storage 藉由使用Experience Platform UI。
您也可以使用Experience Platform API來匯出資料集。 閱讀 匯出資料集API教學課程 以取得詳細資訊。
可用於匯出的資料集 datasets-to-export
您可以匯出的資料集因Experience Platform應用程式(Real-Time CDP、Adobe Journey Optimizer)、階層(Prime或Ultimate)以及您購買的任何附加元件(例如:Data Distiller)而異。
根據您購買的應用程式、產品層級和任何附加元件,從下表瞭解您可以匯出的資料集型別:
- 透過Sources、Web SDK、Mobile SDK、Analytics Data Connector和Audience Manager擷取或收集資料後,在Experience Platform UI中建立的設定檔和體驗事件資料集。
- 系統產生的設定檔快照集資料集.
透過Sources、Web SDK、Mobile SDK、Analytics Data Connector和Audience Manager擷取或收集資料後,在Experience Platform UI中建立的設定檔和體驗事件資料集。
可用性注意事項: 將資料集匯出至雲端的功能目前處於發行的「有限測試」階段,可能在您的環境中尚未提供使用。 當該功能供一般用途時,此備註將被刪除。如需Customer Journey Analytics發行程式的相關資訊,請參閱 Customer Journey Analytics功能發行.
教學課程影片 video-tutorial
請觀看下方的影片,瞭解本頁所述工作流程的端對端說明、使用匯出資料集功能的好處,以及一些建議的使用案例。
支援的目的地 supported-destinations
目前,您可以將資料集匯出至熒幕擷取畫面中強調並列於下方的雲端儲存空間目的地。
何時啟用對象或匯出資料集 when-to-activate-audiences-or-activate-datasets
Experience Platform目錄中的某些檔案型目的地同時支援對象啟用和資料集匯出。
- 當您想要將資料結構化為依對象興趣或資格分組的設定檔時,請考慮啟用對象。
- 或者,當您想要匯出原始資料集時,也可以考慮匯出資料集,這些資料集未根據對象興趣或資格進行分組或結構化。 您可以將這些資料用於報表、資料科學工作流程和其他許多使用案例。 例如,身為管理員、資料工程師或分析師,您可以從Experience Platform匯出資料,以便與資料倉儲同步、在BI分析工具、外部雲端ML工具中使用,或儲存在您的系統中以符合長期儲存需求。
本檔案包含匯出資料集所需的所有資訊。 如果您要啟動 對象 若要存取雲端儲存空間或電子郵件行銷目的地,請閱讀 啟用對象資料至批次設定檔匯出目的地.
先決條件 prerequisites
若要將資料集匯出至雲端儲存空間目的地,您必須已成功完成 已連線至目的地. 如果您尚未這麼做,請前往 目的地目錄,瀏覽支援的目的地,並設定您要使用的目的地。
必要權限 permissions
若要匯出資料集,您需要 檢視目的地, 檢視資料集、和 管理和啟用資料集目的地 存取控制許可權. 閱讀 存取控制總覽 或聯絡您的產品管理員以取得必要許可權。
為確保您擁有匯出資料集的必要許可權以及目的地支援匯出資料集,請瀏覽目的地目錄。 如果目的地有 啟動 或 匯出資料集 控制項,則表示您擁有適當的許可權。
選取您的目的地 select-destination
依照指示選取可匯出資料集的目的地:
-
前往 連線>目的地,然後選取 目錄 標籤。
-
選取 啟動 或 匯出資料集 位於對應您要匯出資料集之目的地的卡片上。
-
選取 資料型別資料集 並選取您要匯出資料集的目的地連線,然後選取「 」 下一個.
- 此 選取資料集 檢視出現。 繼續下一節至 選取您的資料集 以匯出。
選取您的資料集 select-datasets
使用資料集名稱左側的核取方塊來選取您要匯出至目的地的資料集,然後選取「 」 下一個.
排程資料集匯出 scheduling
在 正在排程 步驟,您可以設定資料集匯出的開始日期和匯出步調。
此 匯出增量檔案 選項會自動選取。 這會觸發一或多個檔案的匯出,這些檔案代表資料集的完整快照。 後續檔案是自上次匯出以來的資料集增量新增。
-
使用 頻率 選擇器以選取匯出頻率:
- 每日:排程增量檔案每天於您指定的時間匯出一次。
- 每小時:排程每3、6、8或12小時匯出一次增量檔案。
-
使用 時間 選擇器來選擇一天中的時間,在 UTC 格式,應何時進行匯出。
-
使用 日期 選擇器來選擇應進行匯出的間隔。 請注意,您目前無法設定匯出的結束日期。 如需詳細資訊,請檢視 已知限制 區段。
-
選取 下一個 以儲存排程並前往 檢閱 步驟。
檢閱 review
在 檢閱 頁面中,您可以看到選取範圍的摘要。 選取 取消 若要分解流量, 返回 以修改您的設定,或 完成 以確認您的選取範圍並開始將資料集匯出至目的地。
驗證資料集匯出成功 verify
匯出資料集時,Experience Platform會建立一或多個 .json
或 .parquet
檔案的儲存位置。 預期會根據您提供的匯出排程,將新檔案儲存在您的儲存位置。
Experience Platform會在您指定的儲存位置中建立資料夾結構,並存放匯出的資料集檔案。 每次匯出時都會建立一個新資料夾,其模式如下:
folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
預設檔案名稱是隨機產生的,並確保匯出的檔案名稱是唯一的。
範例資料集檔案 sample-files
這些檔案存在於您的儲存位置即表示匯出成功。 若要瞭解匯出檔案的結構,您可以下載範例 .parquet檔案 或 .json檔案.
壓縮的資料集檔案 compressed-dataset-files
在 連線到目標工作流程,您可以選取要壓縮的匯出資料集檔案,如下所示:
請注意兩種檔案型別在壓縮時的檔案格式差異:
- 匯出壓縮的JSON檔案時,匯出的檔案格式為
json.gz
- 匯出壓縮的parquet檔案時,匯出的檔案格式為
gz.parquet
從目的地移除資料集 remove-dataset
若要從現有資料流移除資料集,請遵循下列步驟:
-
登入 EXPERIENCE PLATFORMUI 並選取 目的地 從左側導覽列。 選取 瀏覽 以檢視您現有的目的地資料流。
note tip TIP 選取篩選器圖示 -
從 啟用資料 欄,選取資料集控制項以檢視對應至此匯出資料流的所有資料集。
-
[測試版]{class="badge informative"} 此 啟用資料 目的地頁面隨即顯示。 使用資料集清單左側的核取方塊來選取您要移除的資料集,然後選取「 」 移除資料集 在右側邊欄中,以觸發移除資料集確認對話方塊。
note note NOTE 此功能為測試版,僅供特定客戶使用。 若要要求存取此功能,請聯絡您的Adobe代表。 -
在確認對話方塊中,選取 移除 立即將資料集從匯出至目的地時移除。
資料集匯出權益 licensing-entitlement
請參閱產品說明檔案,瞭解您每年有權為每個Experience Platform應用程式匯出多少資料。 例如,您可以檢視Real-Time CDP產品說明 此處.
請注意,不同應用程式的資料匯出許可權並非累加。 例如,這表示如果您購買Real-Time CDP Ultimate和Adobe Journey Optimizer Ultimate,則根據產品說明,設定檔匯出許可權將是兩個許可權中較大者。 您的容量權益的計算方式為:取用您的授權設定檔總數,再乘以Real-Time CDP Prime的500 KB或Real-Time CDP Ultimate的700 KB,以判斷您有權取得的資料量。
另一方面,如果您購買了Data Distiller等附加元件,您有權取得的資料匯出限制則代表產品層級和附加元件的總和。
您可以在授權儀表板中,根據合約限制檢視及追蹤您的設定檔匯出。
已知限制 known-limitations
針對資料集匯出的一般可用性版本,請記住下列限制:
- 目前,您只能匯出增量檔案,並且無法為資料集匯出選取結束日期。
- 匯出的檔案名稱目前無法自訂。
- 透過API建立的資料集目前無法匯出。
- UI目前不會阻止您刪除匯出至目的地的資料集。 請勿刪除匯出至目的地的資料集。 移除資料集 從目的地資料流中刪除之前。
- 資料集匯出的監控量度目前與設定檔匯出的數字混合在一起,因此不能反映真正的匯出數字。
- 時間戳記超過365天的資料會從資料集匯出中排除。 如需詳細資訊,請檢視 排程資料集匯出的護欄