Esportare i set di dati
Questo articolo illustra come utilizzare Customer Journey Analytics Export datasets per implementare il seguente caso d'uso per l'esportazione dei dati:
- Backup dei dati
Introduzione
L'esportazione dei dati tramite Experience Platform Export datasets consente di esportare i dati dalle visualizzazioni dati del Customer Journey Analytics a qualsiasi destinazione di archiviazione cloud.
Ulteriori informazioni
Puoi esportare i set di dati non elaborati dal data lake in Experience Platform nelle destinazioni di archiviazione cloud. Questa esportazione si trova nella terminologia di Experience Platform Destinations, o destinazioni di esportazione del set di dati. Per una panoramica, consulta Esportare i set di dati nelle destinazioni dell'archiviazione cloud.
Sono supportate le seguenti destinazioni di archiviazione cloud:
Interfaccia utente Experience Platform
Puoi esportare e pianificare l’esportazione dei set di dati tramite l’interfaccia utente di Experience Platform. Questa sezione descrive i passaggi necessari.
Seleziona destinazione
Dopo aver determinato la destinazione dell'archiviazione cloud in cui desideri esportare il set di dati, seleziona la destinazione. Se non hai ancora configurato una destinazione per l'archiviazione cloud preferita, devi creare una nuova connessione di destinazione.
Durante la configurazione di una destinazione, puoi definire:
- il tipo di file (JSON o Parquet),
- se il file risultante deve essere compresso o meno e
- se un file manifesto deve essere incluso o meno.
Seleziona set di dati
Dopo aver selezionato la destinazione, nel passaggio successivo di Select datasets devi selezionare il set di dati dall'elenco dei set di dati. Se hai creato più query pianificate e desideri che i set di dati vengano inviati alla stessa destinazione di archiviazione cloud, puoi selezionare i set di dati corrispondenti. Per ulteriori informazioni, consulta Selezionare i set di dati.
Pianificare l’esportazione di set di dati
Infine, pianificare l'esportazione del set di dati come parte del passaggio Scheduling. In questo passaggio puoi definire la pianificazione e se l’esportazione del set di dati deve essere incrementale o meno. Per ulteriori informazioni, consulta Pianificazione esportazione set di dati.
Passaggi finali
Rivedi la selezione e, se corretto, inizia a esportare il set di dati nella destinazione dell'archiviazione cloud.
Innanzitutto, devi verificare che l'esportazione dei dati sia andata a buon fine. Durante l'esportazione dei set di dati, Experience Platform crea uno o più file .json
o .parquet
nel percorso di archiviazione definito nella destinazione. I nuovi file verranno archiviati nel percorso di archiviazione in base alla pianificazione di esportazione configurata. In Experience Platform viene creata una struttura di cartelle nel percorso di archiviazione specificato come parte della destinazione selezionata, in cui vengono depositati i file esportati. Viene creata una nuova cartella per ogni esportazione, seguendo il modello: folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
. Il nome di file predefinito viene generato in modo casuale e garantisce che i nomi di file esportati siano univoci.
API del servizio Flusso
In alternativa, puoi esportare e pianificare l’esportazione dei set di dati utilizzando le API. I passaggi necessari sono documentati in Esporta i set di dati utilizzando l'API del servizio Flusso.
Introduzione
Per esportare i set di dati, assicurati di disporre delle autorizzazioni richieste. Verifica inoltre che la destinazione in cui desideri inviare il set di dati supporti l’esportazione dei set di dati. È quindi necessario raccogliere i valori per le intestazioni obbligatorie e facoltative utilizzate nelle chiamate API. È inoltre necessario identificare la specifica di connessione e gli ID delle specifiche di flusso della destinazione in cui si desidera esportare i set di dati.
Recuperare i set di dati idonei
È possibile recuperare un elenco di set di dati idonei per l'esportazione e verificare se il set di dati fa parte di tale elenco utilizzando l'API GET /connectionSpecs/{id}/configs
.
Crea connessione sorgente
Successivamente, è necessario creare una connessione di origine per il set di dati, utilizzando il relativo ID univoco, che si desidera esportare nella destinazione dell'archiviazione cloud. Utilizza l'API POST /sourceConnections
.
Autentica nella destinazione (crea connessione di base)
È ora necessario creare una connessione di base per autenticare e archiviare in modo sicuro le credenziali nella destinazione di archiviazione cloud utilizzando l'API POST /targetConection
.
Fornire parametri di esportazione
Successivamente, è necessario creare una connessione di destinazione aggiuntiva in cui memorizzare i parametri di esportazione per il set di dati utilizzando, ancora una volta, l'API POST /targetConection
. Questi parametri di esportazione includono posizione, formato file, compressione e altro ancora.
Imposta flusso di dati
Infine, imposta il flusso di dati per garantire che il set di dati venga esportato nella destinazione di archiviazione cloud utilizzando l'API POST /flows
. In questo passaggio è possibile definire la pianificazione per l'esportazione utilizzando il parametro scheduleParams
.
Convalida flusso di dati
Per verificare le esecuzioni riuscite del flusso di dati, utilizza l'API GET /runs
, specificando l'ID del flusso di dati come parametro di query. Questo ID del flusso di dati è un identificatore restituito quando imposti il flusso di dati.
Verifica un'esportazione dei dati completata. Durante l'esportazione dei set di dati, Experience Platform crea uno o più file .json
o .parquet
nel percorso di archiviazione definito nella destinazione. I nuovi file verranno archiviati nel percorso di archiviazione in base alla pianificazione di esportazione configurata. In Experience Platform viene creata una struttura di cartelle nel percorso di archiviazione specificato come parte della destinazione selezionata, in cui vengono depositati i file esportati. Viene creata una nuova cartella per ogni esportazione, seguendo il modello: folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
. Il nome di file predefinito viene generato in modo casuale e garantisce che i nomi di file esportati siano univoci.