將資料集匯出至雲端儲存空間目的地
- 已購買Real-Time CDP Prime或Ultimate套件、Adobe Journey Optimizer或Customer Journey Analytics的客戶可使用此功能。 如需詳細資訊,請聯絡您的Adobe代表。
本文說明使用Experience PlatformUI將資料集從Adobe Experience Platform匯出至您偏好的雲端儲存空間位置(例如Amazon S3、SFTP位置或Google Cloud Storage)所需的工作流程。
您也可以使用Experience Platform API來匯出資料集。 如需詳細資訊,請參閱匯出資料集API教學課程。
可用於匯出的資料集 datasets-to-export
您可以匯出的資料集因Experience Platform應用程式(Real-Time CDP、Adobe Journey Optimizer)、階層(Prime或Ultimate)以及您購買的任何附加元件(例如:Data Distiller)而異。
根據您購買的應用程式、產品層級和任何附加元件,從下表瞭解您可以匯出的資料集型別:
- 透過Sources、Web SDK、Mobile SDK、Analytics Data Connector和Audience Manager擷取或收集資料後,在Experience Platform UI中建立的設定檔和體驗事件資料集。
- 系統產生的設定檔快照集資料集。
透過Sources、Web SDK、Mobile SDK、Analytics Data Connector和Audience Manager擷取或收集資料後,在Experience Platform UI中建立的設定檔和體驗事件資料集。
可用性注意事項: 將資料集匯出至雲端的功能處於發行的「有限測試」階段,可能尚未在您的環境中提供。 當功能正式可用時,將移除此附註。 如需Customer Journey Analytics發行程式的相關資訊,請參閱Customer Journey Analytics功能發行。
教學課程影片 video-tutorial
請觀看下方的影片,瞭解本頁所述工作流程的端對端說明、使用匯出資料集功能的好處,以及一些建議的使用案例。
支援的目的地 supported-destinations
目前,您可以將資料集匯出至熒幕擷取畫面中強調並列於下方的雲端儲存空間目的地。
何時啟用對象或匯出資料集 when-to-activate-audiences-or-activate-datasets
Experience Platform目錄中的某些檔案型目的地同時支援對象啟用和資料集匯出。
- 當您想要將資料結構化為依對象興趣或資格分組的設定檔時,請考慮啟用對象。
- 或者,當您想要匯出原始資料集時,也可以考慮匯出資料集,這些資料集未根據對象興趣或資格進行分組或結構化。 您可以將這些資料用於報表、資料科學工作流程和其他許多使用案例。 例如,身為管理員、資料工程師或分析師,您可以從Experience Platform匯出資料,以便與資料倉儲同步、在BI分析工具、外部雲端ML工具中使用,或儲存在您的系統中以符合長期儲存需求。
本檔案包含匯出資料集所需的所有資訊。 如果您想要將 對象 啟動至雲端儲存空間或電子郵件行銷目的地,請閱讀啟動對象資料至批次設定檔匯出目的地。
先決條件 prerequisites
若要將資料集匯出至雲端儲存空間目的地,您必須已成功連線至目的地。 如果您尚未這麼做,請前往目的地目錄,瀏覽支援的目的地,並設定您要使用的目的地。
必要權限 permissions
若要匯出資料集,您需要 檢視目的地、檢視資料集 以及 管理和啟用資料集目的地 存取控制許可權。 閱讀存取控制總覽或連絡您的產品管理員以取得必要的許可權。
為確保您擁有匯出資料集的必要許可權以及目的地支援匯出資料集,請瀏覽目的地目錄。 如果目的地有 啟用 或 匯出資料集 控制項,則您擁有適當的許可權。
選取您的目的地 select-destination
依照指示選取可匯出資料集的目的地:
-
移至 連線>目的地,然後選取 目錄 標籤。
-
在對應您要匯出資料集之目的地的卡片上,選取 啟用 或 匯出資料集。
-
選取 資料型別資料集,並選取您要匯出資料集的目的地連線,然後選取 下一步。
- 選取資料集 檢視就會顯示。 繼續下一節以選取要匯出的資料集。
選取您的資料集 select-datasets
使用資料集名稱左邊的核取方塊來選取您要匯出至目的地的資料集,然後選取 下一步。
排程資料集匯出 scheduling
在 排程 步驟中,您可以設定資料集匯出的開始日期和匯出步調。
已自動選取 匯出增量檔案 選項。 這會觸發一或多個檔案的匯出,這些檔案代表資料集的完整快照。 後續檔案是自上次匯出以來的資料集增量新增。
-
使用 頻率 選擇器來選取匯出頻率:
- 每日:排程增量檔案匯出一次,每天一次,在您指定的時間。
- 每小時:排程每3、6、8或12小時匯出一次增量檔案。
-
使用 Time 選擇器來選擇要進行匯出的時間(格式為UTC)。
-
使用 日期 選擇器來選擇匯出發生的間隔。 請注意,您目前無法設定匯出的結束日期。 如需詳細資訊,請檢視已知限制區段。
-
選取 下一步 以儲存排程並繼續 檢閱 步驟。
檢閱 review
在 檢閱 頁面上,您可以看到選取專案的摘要。 選取 取消 以中斷流程,上一步 以修改您的設定,或選取 完成 以確認您的選取並開始將資料集匯出至目的地。
驗證資料集匯出成功 verify
匯出資料集時,Experience Platform會在您提供的儲存位置中建立一或多個.json
或.parquet
檔案。 預期會根據您提供的匯出排程,將新檔案儲存在您的儲存位置。
Experience Platform會在您指定的儲存位置中建立資料夾結構,並存放匯出的資料集檔案。 每次匯出時都會建立一個新資料夾,其模式如下:
folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
預設檔案名稱是隨機產生的,並確保匯出的檔案名稱是唯一的。
範例資料集檔案 sample-files
這些檔案存在於您的儲存位置即表示匯出成功。 若要瞭解匯出的檔案是如何建構的,您可以下載範例.parquet檔案或.json檔案。
壓縮的資料集檔案 compressed-dataset-files
在連線到目的地工作流程中,您可以選取要壓縮的匯出資料集檔案,如下所示:
請注意兩種檔案型別在壓縮時的檔案格式差異:
- 匯出壓縮的JSON檔案時,匯出的檔案格式為
json.gz
- 匯出壓縮的parquet檔案時,匯出的檔案格式為
gz.parquet
從目的地移除資料集 remove-dataset
若要從現有資料流移除資料集,請遵循下列步驟:
-
登入Experience PlatformUI,並從左側導覽列中選取 目的地。 從頂端標題選取 瀏覽 以檢視您現有的目的地資料流。
note tip TIP 選取左上方的篩選圖示 以啟動排序面板。 排序面板會提供您所有目的地的清單。 您可以從清單中選取多個目的地,以檢視與所選目的地相關聯的資料流篩選選取專案。 -
從 啟用資料 欄中,選取資料集控制項,以檢視對應至此匯出資料流的所有資料集。
-
[Beta]{class="badge informative"}目的地的 啟用資料 頁面就會顯示。 使用資料集清單左側的核取方塊來選取您要移除的資料集,然後在右側邊欄中選取 移除資料集,以觸發移除資料集確認對話方塊。
note note NOTE 此功能為測試版,僅供特定客戶使用。 若要要求存取此功能,請聯絡您的Adobe代表。 -
在確認對話方塊中,選取 移除 以立即從匯出至目的地的資料集中移除資料集。
資料集匯出權益 licensing-entitlement
請參閱產品說明檔案,瞭解您每年有權為每個Experience Platform應用程式匯出多少資料。 例如,您可以在這裡檢視Real-Time CDP產品說明。
請注意,不同應用程式的資料匯出許可權並非累加。 例如,這表示如果您購買Real-Time CDP Ultimate和Adobe Journey Optimizer Ultimate,則根據產品說明,設定檔匯出許可權將是兩個許可權中較大者。 您的容量權益的計算方式為:取用您的授權設定檔總數,再乘以Real-Time CDP Prime的500 KB或Real-Time CDP Ultimate的700 KB,以判斷您有權取得的資料量。
另一方面,如果您購買了Data Distiller等附加元件,您有權取得的資料匯出限制則代表產品層級和附加元件的總和。
您可以在授權儀表板中,根據合約限制檢視及追蹤您的設定檔匯出。
已知限制 known-limitations
針對資料集匯出的一般可用性版本,請記住下列限制:
- 目前,您只能匯出增量檔案,並且無法為資料集匯出選取結束日期。
- 匯出的檔案名稱目前無法自訂。
- 透過API建立的資料集目前無法匯出。
- UI目前不會阻止您刪除匯出至目的地的資料集。 請勿刪除匯出至目的地的資料集。 請先從目的地資料流移除資料集,然後再刪除它。
- 資料集匯出的監控量度目前與設定檔匯出的數字混合在一起,因此不能反映真正的匯出數字。
- 時間戳記超過365天的資料會從資料集匯出中排除。 如需詳細資訊,請檢視排程資料集匯出的護欄