Esportare i set di dati nelle destinazioni dell’archiviazione cloud
endTime
data per l'esportazione dei flussi di dati dei set di dati. Adobe Systems inoltre ha introdotto una data di fine predefinita del 1° maggio 2025 per tutti i flussi di dati di esportazione dei set di dati creati prima della versione di settembre 2024.Questo articolo spiega il flusso di lavoro necessario per esportare set di dati da Adobe Experience Platform nel percorso di archiviazione cloud preferito, ad esempio Amazon S3, percorsi SFTP o Google Cloud Storage tramite l'interfaccia utente di Experience Platform.
Puoi anche utilizzare le API di Experience Platform per esportare i set di dati. Per ulteriori informazioni, consulta l'esercitazione sull'esportazione di dataset API.
Set di dati disponibili per l’esportazione datasets-to-export
I set di dati che puoi esportare variano in base all’applicazione Experience Platform (Real-Time CDP, Adobe Journey Optimizer), al livello (Prime o Ultimate) ed eventuali componenti aggiuntivi acquistati (ad esempio, Data Distiller).
Utilizza la tabella seguente per capire quali tipi di set di dati puoi esportare in base all’applicazione, al livello di prodotto ed eventuali componenti aggiuntivi acquistati:
- Set di dati di eventi di profilo ed esperienza creati nel Experience Platform interfaccia dopo l'inserimento o la raccolta di dati tramite Origini, Web SDK, Mobile SDK Analytics Data Connector e Audience Manager.
- Set di dati Snapshot profilo generato dal sistema.
Esercitazione video video-tutorial
Guarda il video seguente per una spiegazione end-to-end del flusso di lavoro descritto in questa pagina, i vantaggi dell’utilizzo della funzionalità di esportazione dei set di dati e alcuni casi d’uso consigliati.
Destinazioni supportati supported-destinations
Al momento, puoi esportare i set di dati nelle destinazioni di archiviazione cloud evidenziate nella schermata ed elencate di seguito.
Quando attivare tipi di pubblico o esportare set di dati when-to-activate-audiences-or-activate-datasets
Alcune destinazioni basate su file nel catalogo Experience Platform supportano sia l’attivazione del pubblico che l’esportazione di set di dati.
- Considera l’attivazione di tipi di pubblico quando desideri che i dati siano strutturati in profili raggruppati per interessi o qualifiche di pubblico.
- In alternativa, puoi prendere in considerazione le esportazioni di set di dati quando desideri esportare set di dati non elaborati, che non sono raggruppati o strutturati in base agli interessi o alle qualifiche del pubblico. Puoi utilizzare questi dati per reporting, flussi di lavoro sulla scienza dei dati e molti altri casi d’uso. Ad esempio, in qualità di amministratore, data engineer o analista, puoi esportare i dati da Experience Platform per sincronizzarli con il tuo data warehouse, utilizzarli in strumenti di analisi BI, in strumenti di ML cloud esterni o archiviarli nel tuo sistema per esigenze di archiviazione a lungo termine.
Questo documento contiene tutte le informazioni necessarie per esportare i set di dati. Se desideri attivare i tipi di pubblico in cloud destinazioni di archiviazione o marketing via e-mail, consulta Attivare i dati del pubblico per esportare in batch le destinazioni.
Prerequisiti prerequisites
Per esportare i dataset in cloud destinazioni di archiviazione, è necessario essersi connessi correttamente a una destinazione. Se non l'hai già fatto, passa al catalogo delle destinazioni, sfoglia le destinazioni supportate e configura la destinazione che desideri utilizzare.
Autorizzazioni richieste permissions
Per esportare i dataset, sono necessarie le autorizzazioni Visualizza Destinazioni], Visualizza dataset e Gestisci e attiva destinazioni set di dati accesso di controllo. Leggi la panoramica sul [controllo accesso o contatta l'amministratore del prodotto per ottenere le autorizzazioni necessarie.
Per assicurarti di disporre delle autorizzazioni necessarie per esportare i set di dati e che la destinazione supporti l’esportazione dei set di dati, sfoglia il catalogo delle destinazioni. Se una destinazione dispone di un controllo Attiva o Esporta set di dati, si dispone delle autorizzazioni appropriate.
Seleziona la destinazione select-destination
Segui le istruzioni per selezionare una destinazione in cui puoi esportare i set di dati:
-
Vai a Connessioni > Destinazioni e seleziona la scheda Catalogo.
-
Selezionare Attiva o Esporta dataset nel scheda corrispondente alla destinazione in cui si desidera esportare i dataset.
-
Seleziona Set di dati di tipo dati e seleziona la connessione di destinazione in cui desideri esportare i set di dati, quindi seleziona Avanti.
- Viene visualizzata la vista Seleziona set di dati. Passare alla sezione successiva per selezionare i set di dati da esportare.
Seleziona i tuoi set di dati select-datasets
Utilizzare le caselle di controllo a sinistra dei nomi dei set di dati per selezionare i set di dati che si desidera esportare nella destinazione, quindi selezionare Successivo.
Pianificare l’esportazione di set di dati scheduling
Utilizza il passaggio Pianificazione per:
- Imposta una data di inizio e una data di fine, nonché una cadenza di esportazione per le esportazioni dei set di dati.
- Configura se i file del set di dati esportati devono esportare l’appartenenza completa al set di dati o solo modifiche incrementali all’appartenenza a ogni occorrenza di esportazione.
- Personalizzare il percorso della cartella nel percorso di archiviazione in cui esportare i set di dati. Ulteriori informazioni su come modificare il percorso🔗 della cartella di esportazione.
Utilizzare il controllo programmare Modifica nella pagina per modificare la cadenza di esportazione delle esportazioni e per selezionare se esportare file completi o incrementali.
L'opzione Esporta file incrementali è selezionata per impostazione predefinita. Questo attiva un’esportazione di uno o più file che rappresentano un’istantanea completa del set di dati. I file successivi sono aggiunte incrementali al set di dati dall’esportazione precedente. È inoltre possibile selezionare Esporta file completi. In questo caso, seleziona la frequenza Una volta per un'esportazione completa una tantum del set di dati.
-
Utilizza il selettore Frequenza per selezionare la frequenza di esportazione:
- Giornaliero: pianifica le esportazioni di file incrementali una volta al giorno, ogni giorno, al momento specificato.
- Ogni ora: pianifica esportazioni incrementali di file ogni 3, 6, 8 o 12 ore.
-
Utilizzare la selettore Tempo per scegliere l'ora del giorno, in UTC formato, in cui deve avvenire l'esportazione.
-
Utilizzare il selettore Data per scegliere l'intervallo in cui deve avvenire l'esportazione.
-
Selezionare Salva per salvare il programmare e procedere al passaggio Revisione .
Modificare il percorso della cartella edit-folder-path
Seleziona Modifica percorso cartella per personalizzare la struttura delle cartelle nel percorso di archiviazione in cui vengono depositati i set di dati esportati.
È possibile utilizzare diverse macro disponibili per personalizzare il nome di una cartella desiderata. Fare doppio clic su una macro per aggiungerla al percorso della cartella e utilizzare /
tra le macro per separare le cartelle.
Dopo aver selezionato le macro desiderate, è possibile visualizzare un'anteprima della struttura di cartelle che verrà creata nel percorso di archiviazione. Il primo livello nella struttura delle cartelle rappresenta il percorso cartella indicato quando si è connessi alla destinazione per esportare i set di dati.
Rivisione review
Nella pagina Revisione, puoi visualizzare un riepilogo della selezione. Selezionare Annulla per interrompere il flusso Indietro per modificare le impostazioni oppure Fine per confermare la selezione e iniziare a esportare i set di dati nella destinazione.
Verifica l'avvenuta esportazione del set di dati verify
Durante l'esportazione dei set di dati, Experience Platform crea uno o più file .json
o .parquet
nel percorso di archiviazione fornito. I nuovi file verranno archiviati nel percorso di archiviazione in base alla pianificazione di esportazione fornita.
Experience Platform crea una struttura di cartelle nel percorso di archiviazione specificato, dove deposita i file del set di dati esportati. Il modello di esportazione delle cartelle predefinito è illustrato di seguito, ma è possibile personalizzare la struttura delle cartelle con le macro preferite.
folder-name-you-provided
- rappresenta il percorso cartella che hai indicato quando ti sei connesso alla destinazione per esportare i set di dati.folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
Il nome file predefinito viene generato in modo casuale e garantisce che i nomi dei file esportati siano univoci.
File di set di dati di esempio sample-files
La presenza di questi file nel percorso di archiviazione è la conferma di un'esportazione riuscita. Per comprendere la struttura dei file esportati, è possibile scaricare un file🔗 parquet di esempio o un file .json.
File di set di dati compressi compressed-dataset-files
Nel flusso di lavoro connetti a destinazione, è possibile selezionare i file del set di dati esportati da comprimere, come illustrato di seguito:
Notare la differenza nel formato di file tra i due tipi di file, quando compressi:
- Quando si esportano file JSON compressi, il formato di file esportato è
json.gz
. Il formato del JSON esportato è NDJSON, che è il formato di interscambio standard nell'ecosistema big data. Adobe Systems consiglia di utilizzare un client compatibile con NDJSON per leggere i file esportati. - Quando si esportano file parquet compressi, il formato di file esportato è
gz.parquet
Le esportazioni in file JSON sono supportate solo in modalità compressa. Le esportazioni in file Parquet sono supportate in modalità compressa e non compressa.
Rimuovere i set di dati dalle destinazioni remove-dataset
Per rimuovere i set di dati da un flusso di dati esistente, effettua le seguenti operazioni:
-
Accedi all'interfaccia utente di Experience Platform e seleziona Destinazioni dalla barra di navigazione a sinistra. Seleziona Sfoglia dall'intestazione superiore per visualizzare i flussi di dati di destinazione esistenti.
note tip TIP Seleziona l'icona del filtro -
Dalla colonna Dati attivazione, seleziona il controllo Set di dati per visualizzare tutti i set di dati mappati a questo flusso di dati di esportazione.
-
Viene visualizzata la pagina Dati attivazione per la destinazione. Utilizza le caselle di controllo a sinistra dell'elenco dei set di dati per selezionare i set di dati da rimuovere, quindi seleziona Rimuovi set di dati nella barra a destra per attivare la finestra di dialogo di conferma della rimozione dei set di dati.
-
Nella finestra di dialogo di conferma, selezionare Rimuovi per rimuovere immediatamente il set di dati dalle esportazioni verso la destinazione.
Diritti all'esportazione di set di dati licensing-entitlement
Fai riferimento ai documenti di descrizione del prodotto per capire quanti dati hai il diritto di esportare per ogni Experience Platform applicazione, all'anno. Ad esempio, è possibile visualizzare la Descrizione del prodotto CDP in tempo reale qui.
I diritti all’esportazione di dati per diverse applicazioni non sono additivi. Ciò significa, ad esempio, che se acquisti Real-Time CDP Ultimate e Adobe Journey Optimizer Ultimate, il diritto all’esportazione del profilo sarà il più grande tra i due diritti, in base alle descrizioni del prodotto. Il volume di adesioni viene calcolato prendendo il numero totale di profili con licenza e moltiplicandolo per 500 KB per Real-Time CDP Prime o 700 KB per Real-Time CDP Ultimate per determinare il volume di dati a cui hai diritto.
Se invece sono stati acquistati componenti aggiuntivi come Data Distiller, il limite di esportazione dei dati a cui hai diritto rappresenta la somma del livello prodotto e del componente aggiuntivo.
Puoi visualizzare e tenere traccia delle esportazioni dei profili rispetto ai limiti contrattuali nel dashboard utilizzo licenze.
Limitazioni note known-limitations
Tieni presente le seguenti limitazioni per il rilascio di disponibilità generale delle esportazioni di set di dati:
- Experience Platform può esportare più file anche per set di dati di piccole dimensioni. L’esportazione dei set di dati è progettata per l’integrazione tra sistemi e ottimizzata per le prestazioni, pertanto il numero di file esportati non è personalizzabile.
- I nomi di file esportati non sono attualmente personalizzabili.
- I set di dati creati tramite API non sono attualmente disponibili per l’esportazione.
- L’interfaccia utente non ti blocca attualmente l’eliminazione di un set di dati in fase di esportazione in una destinazione. Non eliminare i set di dati da esportare nelle destinazioni. Rimuovere il set di dati da un flusso di dati di destinazione prima di eliminarlo.
- Le metriche di monitoraggio per le esportazioni dei set di dati sono attualmente mescolate con i numeri per le esportazioni di profilo, pertanto non riflettono i numeri reali delle esportazioni.
- I dati con marca temporale più vecchia di 365 giorni sono esclusi dalle esportazioni dei set di dati. Per ulteriori informazioni, visualizzare i guardrail per le esportazioni pianificate di set di dati
Domande frequenti faq
Possiamo generare un file senza una cartella se salviamo solo come /
percorso della cartella? Inoltre, se non è necessario un percorso della cartella, come verranno generati i file con nomi duplicati in una cartella o in una posizione?
/
per esportare i file per tutti i set di dati nella stessa cartella. Adobe sconsiglia questo per le destinazioni che esportano più set di dati, in quanto i nomi dei file generati dal sistema che appartengono a set di dati diversi verranno combinati nella stessa cartella.È possibile indirizzare il file manifesto a una cartella e i file di dati a un'altra cartella?
È possibile controllare la sequenza o la tempistica di consegna dei file?
Quali formati sono disponibili per il file manifest?
C'è disponibilità API per il file manifest?
Possiamo aggiungere ulteriori dettagli al file manifesto (ad esempio, il conteggio dei record)? In caso affermativo, in che modo?
flowRun
(interrogabile tramite API). Ulteriori informazioni nel monitoraggio delle destinazioni.Come vengono suddivisi i file di dati? Quanti record per file?
Possiamo impostare un soglia (numero di record per file)?
Come si invia di nuovo un set di dati nel caso in cui l'invio iniziale non sia valido?