Esportare i set di dati nelle destinazioni dell’archiviazione cloud

AVAILABILITY
Questa funzionalità è disponibile per i clienti che hanno acquistato il pacchetto Real-Time CDP Prime o Ultimate, Adobe Systems Journey Optimizer o Customer Journey Analytics. Contatta il tuo rappresentante Adobe Systems per ulteriori informazioni.
IMPORTANT
Azione: la versione di settembre 2024 di Experience Platform introdotta l'opzione per impostare una endTime data per l'esportazione dei flussi di dati dei set di dati. Adobe Systems inoltre ha introdotto una data di fine predefinita del 1° maggio 2025 per tutti i flussi di dati di esportazione dei set di dati creati prima della versione di settembre 2024.
Per uno qualsiasi di questi flussi di dati, è necessario aggiornare manualmente la data di fine nel flusso di dati prima della data di fine, altrimenti le esportazioni verranno interrotte a tale data. Utilizza l'interfaccia Experience Platform per vedere quali flussi di dati verranno interrotti il 1° maggio 2025.
Fare riferimento alla sezione pianificazione per informazioni su come modificare la data di fine di un flusso di dati di esportazione di un dataset.

Questo articolo spiega il flusso di lavoro necessario per esportare set di dati da Adobe Experience Platform nel percorso di archiviazione cloud preferito, ad esempio Amazon S3, percorsi SFTP o Google Cloud Storage tramite l'interfaccia utente di Experience Platform.

Puoi anche utilizzare le API di Experience Platform per esportare i set di dati. Per ulteriori informazioni, consulta l'esercitazione sull'esportazione di dataset API.

Set di dati disponibili per l’esportazione datasets-to-export

I set di dati che puoi esportare variano in base all’applicazione Experience Platform (Real-Time CDP, Adobe Journey Optimizer), al livello (Prime o Ultimate) ed eventuali componenti aggiuntivi acquistati (ad esempio, Data Distiller).

Utilizza la tabella seguente per capire quali tipi di set di dati puoi esportare in base all’applicazione, al livello di prodotto ed eventuali componenti aggiuntivi acquistati:

Applicazione/componente aggiuntivo
Livello
Set di dati disponibili per l’esportazione
Real-Time CDP
Prime
Set di dati di eventi di profilo ed esperienza creati nel Experience Platform interfaccia dopo l'inserimento o la raccolta di dati tramite Origini, Web SDK, Mobile SDK Analytics Data Connector e Audience Manager.
Ultimate
  • Set di dati di eventi di profilo ed esperienza creati nel Experience Platform interfaccia dopo l'inserimento o la raccolta di dati tramite Origini, Web SDK, Mobile SDK Analytics Data Connector e Audience Manager.
  • Set di dati Snapshot profilo generato dal sistema.
Adobe Journey Optimizer
Prime
Consulta la documentazione di Adobe Journey Optimizer.
Ultimate
Consulta la documentazione di Adobe Journey Optimizer.
Customer Journey Analytics
Tutto
Set di dati di eventi di profilo ed esperienza creati nel Experience Platform interfaccia dopo l'inserimento o la raccolta di dati tramite Origini, Web SDK, Mobile SDK Analytics Data Connector e Audience Manager.
Data Distiller
Data Distiller (componente aggiuntivo)
Dataset derivati creati tramite Query Service.

Esercitazione video video-tutorial

Guarda il video seguente per una spiegazione end-to-end del flusso di lavoro descritto in questa pagina, i vantaggi dell’utilizzo della funzionalità di esportazione dei set di dati e alcuni casi d’uso consigliati.

Destinazioni supportati supported-destinations

Al momento, puoi esportare i set di dati nelle destinazioni di archiviazione cloud evidenziate nella schermata ed elencate di seguito.

Pagina del catalogo delle destinazioni che mostra quali destinazioni supportano le esportazioni dei set di dati.

Quando attivare tipi di pubblico o esportare set di dati when-to-activate-audiences-or-activate-datasets

Alcune destinazioni basate su file nel catalogo Experience Platform supportano sia l’attivazione del pubblico che l’esportazione di set di dati.

  • Considera l’attivazione di tipi di pubblico quando desideri che i dati siano strutturati in profili raggruppati per interessi o qualifiche di pubblico.
  • In alternativa, puoi prendere in considerazione le esportazioni di set di dati quando desideri esportare set di dati non elaborati, che non sono raggruppati o strutturati in base agli interessi o alle qualifiche del pubblico. Puoi utilizzare questi dati per reporting, flussi di lavoro sulla scienza dei dati e molti altri casi d’uso. Ad esempio, in qualità di amministratore, data engineer o analista, puoi esportare i dati da Experience Platform per sincronizzarli con il tuo data warehouse, utilizzarli in strumenti di analisi BI, in strumenti di ML cloud esterni o archiviarli nel tuo sistema per esigenze di archiviazione a lungo termine.

Questo documento contiene tutte le informazioni necessarie per esportare i set di dati. Se desideri attivare i tipi di pubblico in cloud destinazioni di archiviazione o marketing via e-mail, consulta Attivare i dati del pubblico per esportare in batch le destinazioni.

Prerequisiti prerequisites

Per esportare i dataset in cloud destinazioni di archiviazione, è necessario essersi connessi correttamente a una destinazione. Se non l'hai già fatto, passa al catalogo delle destinazioni, sfoglia le destinazioni supportate e configura la destinazione che desideri utilizzare.

Autorizzazioni richieste permissions

Per esportare i dataset, sono necessarie le autorizzazioni Visualizza Destinazioni], Visualizza dataset e Gestisci e attiva destinazioni set di dati accesso di controllo. Leggi la panoramica sul [controllo accesso o contatta l'amministratore del prodotto per ottenere le autorizzazioni necessarie.

Per assicurarti di disporre delle autorizzazioni necessarie per esportare i set di dati e che la destinazione supporti l’esportazione dei set di dati, sfoglia il catalogo delle destinazioni. Se una destinazione dispone di un controllo Attiva o Esporta set di dati, si dispone delle autorizzazioni appropriate.

Seleziona la destinazione select-destination

Segui le istruzioni per selezionare una destinazione in cui puoi esportare i set di dati:

  1. Vai a Connessioni > Destinazioni e seleziona la scheda Catalogo.

    Il catalogo di destinazione scheda con il controllo Catalog evidenziato.

  2. Selezionare Attiva o Esporta dataset nel scheda corrispondente alla destinazione in cui si desidera esportare i dataset.

    Il catalogo di destinazione scheda con il controllo Attiva evidenziato.

  3. Seleziona Set di dati di tipo dati e seleziona la connessione di destinazione in cui desideri esportare i set di dati, quindi seleziona Avanti.

TIP
Se si desidera impostare una nuova destinazione per esportare i set di dati, selezionare Configura nuova destinazione per attivare il flusso di lavoro Connetti alla destinazione.

Il workflow di attivazione della destinazione con il controllo Dataset evidenziato.

  1. Viene visualizzata la vista Seleziona set di dati. Passare alla sezione successiva per selezionare i set di dati da esportare.

Seleziona i tuoi set di dati select-datasets

Utilizzare le caselle di controllo a sinistra dei nomi dei set di dati per selezionare i set di dati che si desidera esportare nella destinazione, quindi selezionare Successivo.

Lesportazione dei set di dati workflow che mostra il passaggio Seleziona set di dati in cui è possibile selezionare i set di dati da esportare.

Pianificare l’esportazione di set di dati scheduling

Utilizza il passaggio Pianificazione per:

  • Imposta una data di inizio e una data di fine, nonché una cadenza di esportazione per le esportazioni dei set di dati.
  • Configura se i file del set di dati esportati devono esportare l’appartenenza completa al set di dati o solo modifiche incrementali all’appartenenza a ogni occorrenza di esportazione.
  • Personalizzare il percorso della cartella nel percorso di archiviazione in cui esportare i set di dati. Ulteriori informazioni su come modificare il percorso🔗 della cartella di esportazione.

Utilizzare il controllo programmare Modifica nella pagina per modificare la cadenza di esportazione delle esportazioni e per selezionare se esportare file completi o incrementali.

Modifica controllo programmare evidenziato nel passaggio Pianificazione.

L'opzione Esporta file incrementali è selezionata per impostazione predefinita. Questo attiva un’esportazione di uno o più file che rappresentano un’istantanea completa del set di dati. I file successivi sono aggiunte incrementali al set di dati dall’esportazione precedente. È inoltre possibile selezionare Esporta file completi. In questo caso, seleziona la frequenza Una volta per un'esportazione completa una tantum del set di dati.

IMPORTANT
La prima esportazione incrementale di file include tutti i dati esistenti nel set di dati, che funziona come retrocompilazione. L’esportazione può contenere uno o più file.

Flusso di lavoro di esportazione del set di dati che mostra il passaggio di pianificazione.

  1. Utilizza il selettore Frequenza per selezionare la frequenza di esportazione:

    • Giornaliero: pianifica le esportazioni di file incrementali una volta al giorno, ogni giorno, al momento specificato.
    • Ogni ora: pianifica esportazioni incrementali di file ogni 3, 6, 8 o 12 ore.
  2. Utilizzare la selettore Tempo per scegliere l'ora del giorno, in UTC formato, in cui deve avvenire l'esportazione.

  3. Utilizzare il selettore Data per scegliere l'intervallo in cui deve avvenire l'esportazione.

  4. Selezionare Salva per salvare il programmare e procedere al passaggio Revisione.

NOTE
Per le esportazioni dei set di dati, i nomi dei file hanno un formato predefinito che non può essere modificato. Per ulteriori informazioni ed esempi di file esportati, vedere la sezione Verifica dell'esportazione riuscita del set di dati.

Modificare il percorso della cartella edit-folder-path

Seleziona Modifica percorso cartella per personalizzare la struttura delle cartelle nel percorso di archiviazione in cui vengono depositati i set di dati esportati.

Il controllo del percorso della cartella di modifica è evidenziato nel passaggio di pianificazione.

È possibile utilizzare diverse macro disponibili per personalizzare il nome di una cartella desiderata. Fare doppio clic su una macro per aggiungerla al percorso della cartella e utilizzare / tra le macro per separare le cartelle.

Selezione di macro evidenziata nella finestra modale della cartella personalizzata.

Dopo aver selezionato le macro desiderate, è possibile visualizzare un'anteprima della struttura di cartelle che verrà creata nel percorso di archiviazione. Il primo livello nella struttura delle cartelle rappresenta il percorso cartella indicato quando si è connessi alla destinazione per esportare i set di dati.

Anteprima del percorso della cartella evidenziato nella finestra modale della cartella personalizzata.

Rivisione review

Nella pagina Revisione, puoi visualizzare un riepilogo della selezione. Selezionare Annulla per interrompere il flusso Indietro per modificare le impostazioni oppure Fine per confermare la selezione e iniziare a esportare i set di dati nella destinazione.

Lesportazione del set di dati workflow mostra il passaggio di revisione.

Verifica l'avvenuta esportazione del set di dati verify

Durante l'esportazione dei set di dati, Experience Platform crea uno o più file .json o .parquet nel percorso di archiviazione fornito. I nuovi file verranno archiviati nel percorso di archiviazione in base alla pianificazione di esportazione fornita.

Experience Platform crea una struttura di cartelle nel percorso di archiviazione specificato, dove deposita i file del set di dati esportati. Il modello di esportazione delle cartelle predefinito è illustrato di seguito, ma è possibile personalizzare la struttura delle cartelle con le macro preferite.

TIP
Il primo livello in questa struttura di cartelle - folder-name-you-provided - rappresenta il percorso cartella che hai indicato quando ti sei connesso alla destinazione per esportare i set di dati.

folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM

Il nome file predefinito viene generato in modo casuale e garantisce che i nomi dei file esportati siano univoci.

File di set di dati di esempio sample-files

La presenza di questi file nel percorso di archiviazione è la conferma di un'esportazione riuscita. Per comprendere la struttura dei file esportati, è possibile scaricare un file🔗 parquet di esempio o un file .json.

File di set di dati compressi compressed-dataset-files

Nel flusso di lavoro connetti a destinazione, è possibile selezionare i file del set di dati esportati da comprimere, come illustrato di seguito:

File tipo e selezione di compressione quando ci si connette a una destinazione per esportare i dataset.

Notare la differenza nel formato di file tra i due tipi di file, quando compressi:

  • Quando si esportano file JSON compressi, il formato di file esportato è json.gz. Il formato del JSON esportato è NDJSON, che è il formato di interscambio standard nell'ecosistema big data. Adobe Systems consiglia di utilizzare un client compatibile con NDJSON per leggere i file esportati.
  • Quando si esportano file parquet compressi, il formato di file esportato è gz.parquet

Le esportazioni in file JSON sono supportate solo in modalità compressa. Le esportazioni in file Parquet sono supportate in modalità compressa e non compressa.

Rimuovere i set di dati dalle destinazioni remove-dataset

Per rimuovere i set di dati da un flusso di dati esistente, effettua le seguenti operazioni:

  1. Accedi all'interfaccia utente di Experience Platform e seleziona Destinazioni dalla barra di navigazione a sinistra. Seleziona Sfoglia dall'intestazione superiore per visualizzare i flussi di dati di destinazione esistenti.

    Visualizzazione esplorazione di destinazione con una connessione di destinazione visualizzata e il resto offuscato.

    note tip
    TIP
    Seleziona l'icona del filtro Icona filtro in alto a sinistra per avviare il pannello di ordinamento. Il pannello Ordinamento fornisce un elenco di tutte le destinazioni. Puoi selezionare più di una destinazione dall’elenco per visualizzare una selezione filtrata di flussi di dati associati alla destinazione selezionata.
  2. Dalla colonna Dati attivazione, seleziona il controllo Set di dati per visualizzare tutti i set di dati mappati a questo flusso di dati di esportazione.

    Lopzione di navigazione dei set di dati disponibili è evidenziata nella colonna Dati di attivazione.

  3. Viene visualizzata la pagina Dati attivazione per la destinazione. Utilizza le caselle di controllo a sinistra dell'elenco dei set di dati per selezionare i set di dati da rimuovere, quindi seleziona Rimuovi set di dati nella barra a destra per attivare la finestra di dialogo di conferma della rimozione dei set di dati.

    Rimuovi finestra di dialogo dataset che mostra il controllo dataset Rimuovi nel barra destro.

  4. Nella finestra di dialogo di conferma, selezionare Rimuovi per rimuovere immediatamente il set di dati dalle esportazioni verso la destinazione.

    Finestra di dialogo che mostra lopzione Conferma rimozione set di dati dal flusso di dati.

Diritti all'esportazione di set di dati licensing-entitlement

Fai riferimento ai documenti di descrizione del prodotto per capire quanti dati hai il diritto di esportare per ogni Experience Platform applicazione, all'anno. Ad esempio, è possibile visualizzare la Descrizione del prodotto CDP in tempo reale qui.

I diritti all’esportazione di dati per diverse applicazioni non sono additivi. Ciò significa, ad esempio, che se acquisti Real-Time CDP Ultimate e Adobe Journey Optimizer Ultimate, il diritto all’esportazione del profilo sarà il più grande tra i due diritti, in base alle descrizioni del prodotto. Il volume di adesioni viene calcolato prendendo il numero totale di profili con licenza e moltiplicandolo per 500 KB per Real-Time CDP Prime o 700 KB per Real-Time CDP Ultimate per determinare il volume di dati a cui hai diritto.

Se invece sono stati acquistati componenti aggiuntivi come Data Distiller, il limite di esportazione dei dati a cui hai diritto rappresenta la somma del livello prodotto e del componente aggiuntivo.

Puoi visualizzare e tenere traccia delle esportazioni dei profili rispetto ai limiti contrattuali nel dashboard utilizzo licenze.

Limitazioni note known-limitations

Tieni presente le seguenti limitazioni per il rilascio di disponibilità generale delle esportazioni di set di dati:

  • Experience Platform può esportare più file anche per set di dati di piccole dimensioni. L’esportazione dei set di dati è progettata per l’integrazione tra sistemi e ottimizzata per le prestazioni, pertanto il numero di file esportati non è personalizzabile.
  • I nomi di file esportati non sono attualmente personalizzabili.
  • I set di dati creati tramite API non sono attualmente disponibili per l’esportazione.
  • L’interfaccia utente non ti blocca attualmente l’eliminazione di un set di dati in fase di esportazione in una destinazione. Non eliminare i set di dati da esportare nelle destinazioni. Rimuovere il set di dati da un flusso di dati di destinazione prima di eliminarlo.
  • Le metriche di monitoraggio per le esportazioni dei set di dati sono attualmente mescolate con i numeri per le esportazioni di profilo, pertanto non riflettono i numeri reali delle esportazioni.
  • I dati con marca temporale più vecchia di 365 giorni sono esclusi dalle esportazioni dei set di dati. Per ulteriori informazioni, visualizzare i guardrail per le esportazioni pianificate di set di dati

Domande frequenti faq

Possiamo generare un file senza una cartella se salviamo solo come / percorso della cartella? Inoltre, se non è necessario un percorso della cartella, come verranno generati i file con nomi duplicati in una cartella o in una posizione?

Risposta
A partire dalla versione di settembre 2024, è possibile personalizzare il nome della cartella e persino utilizzare / per esportare i file per tutti i set di dati nella stessa cartella. Adobe sconsiglia questo per le destinazioni che esportano più set di dati, in quanto i nomi dei file generati dal sistema che appartengono a set di dati diversi verranno combinati nella stessa cartella.

È possibile indirizzare il file manifesto a una cartella e i file di dati a un'altra cartella?

Risposta
No, non è possibile copiare il file manifesto in una posizione diversa.

È possibile controllare la sequenza o la tempistica di consegna dei file?

Risposta
Sono disponibili opzioni per pianificare l’esportazione. Non sono disponibili opzioni per ritardare o sequenziare la copia dei file. Vengono copiati nella posizione di archiviazione non appena vengono generati.

Quali formati sono disponibili per il file manifest?

Risposta
Il file manifest è in formato .json.

C'è disponibilità API per il file manifest?

Risposta
Nessuna API è disponibile per il file manifesto, ma include un elenco di file che compongono l'esportazione.

Possiamo aggiungere ulteriori dettagli al file manifesto (ad esempio, il conteggio dei record)? In caso affermativo, in che modo?

Risposta
Non è possibile aggiungere ulteriori informazioni al file manifesto. Il conteggio dei record è disponibile tramite l'entità flowRun (interrogabile tramite API). Ulteriori informazioni nel monitoraggio delle destinazioni.

Come vengono suddivisi i file di dati? Quanti record per file?

Risposta
I file di dati vengono suddivisi in base al partizionamento predefinito nel data lake di Experience Platform. I set di dati più grandi hanno un numero più elevato di partizioni. Il partizionamento predefinito non è configurabile dal utente in quanto è ottimizzato per la lettura.

Possiamo impostare un soglia (numero di record per file)?

Risposta
No, non è possibile.

Come si invia di nuovo un set di dati nel caso in cui l'invio iniziale non sia valido?

Risposta
I tentativi vengono eseguiti automaticamente per la maggior parte dei tipi di errori di sistema.
recommendation-more-help
7f4d1967-bf93-4dba-9789-bb6b505339d6