Esportare i set di dati nelle destinazioni dell’archiviazione cloud

AVAILABILITY
  • Questa funzionalità è disponibile per i clienti che hanno acquistato il pacchetto Real-Time CDP Prime o Ultimate, Adobe Journey Optimizer o il Customer Journey Analytics. Per ulteriori informazioni, contatta il rappresentante Adobe.

In questo articolo viene illustrato il flusso di lavoro necessario per esportare set di dati da Adobe Experience Platform nel percorso di archiviazione cloud preferito, ad esempio Amazon S3, percorsi SFTP o Google Cloud Storage tramite l'interfaccia utente di Experience Platform.

Puoi anche utilizzare le API Experience Platform per esportare i set di dati. Per ulteriori informazioni, consulta l'esercitazione sull'esportazione di dataset API.

Set di dati disponibili per l’esportazione datasets-to-export

I set di dati che puoi esportare variano in base all’applicazione di Experience Platform (Real-Time CDP, Adobe Journey Optimizer), al livello (Prime o Ultimate) ed eventuali componenti aggiuntivi acquistati (ad esempio, Data Distiller).

Utilizza la tabella seguente per capire quali tipi di set di dati puoi esportare in base all’applicazione, al livello di prodotto ed eventuali componenti aggiuntivi acquistati:

Applicazione/componente aggiuntivo
Livello
Set di dati disponibili per l’esportazione
Real-Time CDP
Prime
Set di dati di profili ed eventi di esperienza creati nell’interfaccia utente di Experience Platform dopo l’acquisizione o la raccolta di dati tramite Sources, Web SDK, Mobile SDK, Analytics Data Connector ed Audience Manager.
Ultimate
  • Set di dati di profili ed eventi di esperienza creati nell’interfaccia utente di Experience Platform dopo l’acquisizione o la raccolta di dati tramite Sources, Web SDK, Mobile SDK, Analytics Data Connector ed Audience Manager.
  • Set di dati snapshot profilo generato dal sistema.
Adobe Journey Optimizer
Prime
Consulta la documentazione di Adobe Journey Optimizer.
Ultimate
Consulta la documentazione di Adobe Journey Optimizer.
Customer Journey Analytics
Tutto
Set di dati di profili ed eventi di esperienza creati nell’interfaccia utente di Experience Platform dopo l’acquisizione o la raccolta di dati tramite Sources, Web SDK, Mobile SDK, Analytics Data Connector ed Audience Manager.
Data Distiller
Data Distiller (componente aggiuntivo)
Set di dati derivati creati tramite Query Service.

Esercitazione video video-tutorial

Guarda il video seguente per una spiegazione end-to-end del flusso di lavoro descritto in questa pagina, i vantaggi dell’utilizzo della funzionalità di esportazione dei set di dati e alcuni casi d’uso consigliati.

Destinazioni supportati supported-destinations

Al momento, puoi esportare i set di dati nelle destinazioni di archiviazione cloud evidenziate nella schermata ed elencate di seguito.

Pagina del catalogo delle destinazioni che mostra quali destinazioni supportano le esportazioni dei set di dati.

Quando attivare tipi di pubblico o esportare set di dati when-to-activate-audiences-or-activate-datasets

Alcune destinazioni basate su file nel catalogo Experience Platform supportano sia l’attivazione del pubblico che l’esportazione di set di dati.

  • Considera l’attivazione di tipi di pubblico quando desideri che i dati siano strutturati in profili raggruppati per interessi o qualifiche di pubblico.
  • In alternativa, puoi prendere in considerazione le esportazioni di set di dati quando desideri esportare set di dati non elaborati, che non sono raggruppati o strutturati in base agli interessi o alle qualifiche del pubblico. Puoi utilizzare questi dati per reporting, flussi di lavoro sulla scienza dei dati e molti altri casi d’uso. In qualità di amministratore, ingegnere dati o analista, ad esempio, puoi esportare i dati da Experience Platform per sincronizzarli con il data warehouse, utilizzarli in strumenti di analisi BI, in strumenti di ML cloud esterni o archiviarli nel sistema per esigenze di archiviazione a lungo termine.

Questo documento contiene tutte le informazioni necessarie per esportare i set di dati. Se desideri attivare tipi di pubblico nell'archiviazione cloud o nelle destinazioni di e-mail marketing, leggi Attiva dati pubblico nelle destinazioni di esportazione del profilo batch.

Prerequisiti prerequisites

Per esportare i set di dati nelle destinazioni dell'archiviazione cloud, è necessario avere connesso a una destinazione. Se non lo hai già fatto, vai al catalogo delle destinazioni, sfoglia le destinazioni supportate e configura la destinazione che desideri utilizzare.

Autorizzazioni richieste permissions

Per esportare i set di dati, è necessario Visualizzare le destinazioni, Visualizzare i set di dati e Gestire e attivare le destinazioni dei set di dati accedere alle autorizzazioni di controllo. Leggi la panoramica sul controllo degli accessi o contatta l'amministratore del prodotto per ottenere le autorizzazioni necessarie.

Per assicurarti di disporre delle autorizzazioni necessarie per esportare i set di dati e che la destinazione supporti l’esportazione dei set di dati, sfoglia il catalogo delle destinazioni. Se una destinazione dispone di un controllo Attiva o Esporta set di dati, si dispone delle autorizzazioni appropriate.

Seleziona la destinazione select-destination

Segui le istruzioni per selezionare una destinazione in cui puoi esportare i set di dati:

  1. Vai a Connessioni > Destinazioni e seleziona la scheda Catalogo.

    Scheda Catalogo di destinazione con il controllo Catalogo evidenziato.

  2. Seleziona Attiva o Esporta set di dati nella scheda corrispondente alla destinazione in cui desideri esportare i set di dati.

    Scheda Catalogo di destinazione con controllo di attivazione evidenziato.

  3. Seleziona Set di dati di tipo dati e seleziona la connessione di destinazione in cui desideri esportare i set di dati, quindi seleziona Avanti.

TIP
Se si desidera impostare una nuova destinazione per esportare i set di dati, selezionare Configura nuova destinazione per attivare il flusso di lavoro Connetti alla destinazione.

Flusso di lavoro di attivazione della destinazione con il controllo Set di dati evidenziato.

  1. Viene visualizzata la visualizzazione Seleziona set di dati. Procedi alla sezione successiva per selezionare i set di dati per l'esportazione.

Seleziona i set di dati select-datasets

Utilizza le caselle di controllo a sinistra dei nomi dei set di dati per selezionare i set di dati da esportare nella destinazione, quindi seleziona Successivo.

Flusso di lavoro di esportazione del set di dati che mostra il passaggio Seleziona set di dati in cui è possibile selezionare i set di dati da esportare.

Pianificare l’esportazione di set di dati scheduling

Utilizza il passaggio Pianificazione per:

  • Imposta una data di inizio e una data di fine, nonché una cadenza di esportazione per le esportazioni dei set di dati.
  • Configura se i file del set di dati esportati devono esportare l’appartenenza completa al set di dati o solo modifiche incrementali all’appartenenza a ogni occorrenza di esportazione.
  • Personalizza il percorso della cartella nel percorso di archiviazione in cui devono essere esportati i set di dati. Ulteriori informazioni su come modificare il percorso della cartella di esportazione.

Utilizza il controllo Modifica pianificazione nella pagina per modificare la frequenza di esportazione delle esportazioni e per scegliere se esportare file completi o incrementali.

Il controllo Modifica pianificazione è evidenziato nel passaggio Pianificazione.

L'opzione Esporta file incrementali è selezionata per impostazione predefinita. Questo attiva un’esportazione di uno o più file che rappresentano un’istantanea completa del set di dati. I file successivi sono aggiunte incrementali al set di dati dall’esportazione precedente. È inoltre possibile selezionare Esporta file completi. In questo caso, seleziona la frequenza Una volta per un'esportazione completa una tantum del set di dati.

IMPORTANT
La prima esportazione incrementale di file include tutti i dati esistenti nel set di dati, che funziona come retrocompilazione. L’esportazione può contenere uno o più file.

Flusso di lavoro di esportazione del set di dati che mostra il passaggio di pianificazione.

  1. Utilizza il selettore Frequenza per selezionare la frequenza di esportazione:

    • Giornaliero: pianifica le esportazioni di file incrementali una volta al giorno, ogni giorno, al momento specificato.
    • Oraria: pianifica esportazioni di file incrementali ogni 3, 6, 8 o 12 ore.
  2. Utilizza il selettore Ora per scegliere l'ora del giorno, in formato UTC, in cui eseguire l'esportazione.

  3. Utilizza il selettore Data per scegliere l'intervallo in cui deve essere eseguita l'esportazione.

  4. Seleziona Salva per salvare la pianificazione e procedere al passaggio Rivedi.

NOTE
Per le esportazioni di set di dati, i nomi dei file hanno un formato predefinito, predefinito, che non può essere modificato. Per ulteriori informazioni ed esempi di file esportati, vedere la sezione Verifica dell'esportazione del set di dati completata.

Modificare il percorso della cartella edit-folder-path

Seleziona Modifica percorso cartella per personalizzare la struttura delle cartelle nel percorso di archiviazione in cui vengono depositati i set di dati esportati.

Il controllo del percorso della cartella di modifica è evidenziato nel passaggio di pianificazione.

È possibile utilizzare diverse macro disponibili per personalizzare il nome di una cartella desiderata. Fare doppio clic su una macro per aggiungerla al percorso della cartella e utilizzare / tra le macro per separare le cartelle.

Selezione di macro evidenziata nella finestra modale della cartella personalizzata.

Dopo aver selezionato le macro desiderate, è possibile visualizzare un'anteprima della struttura di cartelle che verrà creata nel percorso di archiviazione. Il primo livello nella struttura delle cartelle rappresenta il percorso cartella indicato quando si è connessi alla destinazione per esportare i set di dati.

Anteprima del percorso della cartella evidenziata nella finestra modale della cartella personalizzata.

Controlla review

Nella pagina Rivedi puoi visualizzare un riepilogo della selezione. Seleziona Annulla per interrompere il flusso, Indietro per modificare le impostazioni oppure Fine per confermare la selezione e iniziare a esportare i set di dati nella destinazione.

Flusso di lavoro di esportazione del set di dati che mostra il passaggio di revisione.

Verificare l’esportazione del set di dati verify

Durante l'esportazione dei set di dati, Experience Platform crea uno o più file .json o .parquet nel percorso di archiviazione fornito. I nuovi file verranno archiviati nel percorso di archiviazione in base alla pianificazione di esportazione fornita.

In Experience Platform viene creata una struttura di cartelle nel percorso di archiviazione specificato, in cui vengono depositati i file del set di dati esportati. Il modello di esportazione delle cartelle predefinito è illustrato di seguito, ma è possibile personalizzare la struttura delle cartelle con le macro preferite.

TIP
Il primo livello in questa struttura di cartelle - folder-name-you-provided - rappresenta il percorso cartella che hai indicato quando ti sei connesso alla destinazione per esportare i set di dati.

folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM

Il nome di file predefinito viene generato in modo casuale e garantisce che i nomi di file esportati siano univoci.

File di set di dati di esempio sample-files

La presenza di questi file nel percorso di archiviazione conferma la riuscita dell’esportazione. Per comprendere la struttura dei file esportati, è possibile scaricare un file .parquet di esempio o .json.

File di set di dati compressi compressed-dataset-files

Nel flusso di lavoro connetti a destinazione, è possibile selezionare i file del set di dati esportati da comprimere, come illustrato di seguito:

Tipo di file e selezione della compressione durante la connessione a una destinazione per lesportazione di set di dati.

Quando vengono compressi, si noti la differenza di formato tra i due tipi di file:

  • Durante l'esportazione di file JSON compressi, il formato del file esportato è json.gz. Il formato del JSON esportato è NDJSON, che è il formato di interscambio standard nell'ecosistema dei big data. Adobe consiglia di utilizzare un client compatibile con NDJSON per leggere i file esportati.
  • Durante l'esportazione di file parquet compressi, il formato del file esportato è gz.parquet

Le esportazioni in file JSON sono supportate solo in modalità compressa. Le esportazioni in file Parquet sono supportate in modalità compressa e non compressa.

Rimuovere i set di dati dalle destinazioni remove-dataset

Per rimuovere i set di dati da un flusso di dati esistente, effettua le seguenti operazioni:

  1. Accedi a interfaccia utente Experience Platform e seleziona Destinazioni dalla barra di navigazione a sinistra. Seleziona Sfoglia dall'intestazione superiore per visualizzare i flussi di dati di destinazione esistenti.

    Visualizzazione esplorazione di destinazione con una connessione di destinazione visualizzata e il resto offuscato.

    note tip
    TIP
    Seleziona l'icona del filtro Icona filtro in alto a sinistra per avviare il pannello di ordinamento. Il pannello Ordinamento fornisce un elenco di tutte le destinazioni. Puoi selezionare più di una destinazione dall’elenco per visualizzare una selezione filtrata di flussi di dati associati alla destinazione selezionata.
  2. Dalla colonna Dati attivazione, seleziona il controllo Set di dati per visualizzare tutti i set di dati mappati a questo flusso di dati di esportazione.

    Lopzione di navigazione dei set di dati disponibili è evidenziata nella colonna Dati di attivazione.

  3. Viene visualizzata la pagina Dati attivazione per la destinazione. Utilizza le caselle di controllo a sinistra dell'elenco dei set di dati per selezionare i set di dati da rimuovere, quindi seleziona Rimuovi set di dati nella barra a destra per attivare la finestra di dialogo di conferma della rimozione dei set di dati.

    Finestra di dialogo Rimuovi set di dati che mostra il controllo Rimuovi set di dati nella barra a destra.

  4. Nella finestra di dialogo di conferma, seleziona Rimuovi per rimuovere immediatamente il set di dati dalle esportazioni nella destinazione.

    Finestra di dialogo che mostra lopzione Conferma rimozione set di dati dal flusso di dati.

Diritti di esportazione del set di dati licensing-entitlement

Consulta i documenti di descrizione del prodotto per capire la quantità di dati che hai diritto di esportare per ogni applicazione di Experience Platform all’anno. Ad esempio, puoi visualizzare la descrizione del prodotto Real-Time CDP qui.

I diritti all’esportazione di dati per diverse applicazioni non sono additivi. Ciò significa, ad esempio, che se acquisti Real-Time CDP Ultimate e Adobe Journey Optimizer Ultimate, il diritto all’esportazione del profilo sarà il più grande tra i due diritti, in base alle descrizioni del prodotto. Il volume di adesioni viene calcolato moltiplicando il numero totale di profili con licenza per 500 KB per Real-Time CDP Prime o 700 KB per Real-Time CDP Ultimate per determinare il volume di dati a cui hai diritto.

Se invece sono stati acquistati componenti aggiuntivi come Data Distiller, il limite di esportazione dei dati a cui hai diritto rappresenta la somma del livello prodotto e del componente aggiuntivo.

Puoi visualizzare e tenere traccia delle esportazioni dei profili rispetto ai limiti contrattuali nel dashboard utilizzo licenze.

Limitazioni note known-limitations

Tieni presente le seguenti limitazioni per il rilascio di disponibilità generale delle esportazioni di set di dati:

  • Attualmente, è possibile esportare solo file incrementali e non è possibile selezionare una data di fine per le esportazioni dei set di dati.
  • Experience Platform può esportare più file anche per set di dati di piccole dimensioni. L’esportazione dei set di dati è progettata per l’integrazione tra sistemi e ottimizzata per le prestazioni, pertanto il numero di file esportati non è personalizzabile.
  • I nomi di file esportati non sono attualmente personalizzabili.
  • I set di dati creati tramite API non sono attualmente disponibili per l’esportazione.
  • L’interfaccia utente non ti blocca attualmente l’eliminazione di un set di dati in fase di esportazione in una destinazione. Non eliminare i set di dati da esportare nelle destinazioni. Rimuovere il set di dati da un flusso di dati di destinazione prima di eliminarlo.
  • Le metriche di monitoraggio per le esportazioni di set di dati sono attualmente combinate con i numeri per le esportazioni di profili, pertanto non riflettono i numeri di esportazione effettivi.
  • I dati con una marca temporale precedente ai 365 giorni sono esclusi dalle esportazioni dei set di dati. Per ulteriori informazioni, visualizza guardrail per esportazioni di set di dati pianificate

Domande frequenti faq

È possibile generare un file senza una cartella se si salva solo in / come percorso della cartella? Inoltre, se non è necessario un percorso di cartella, in che modo verranno generati i file con nomi duplicati in una cartella o in un percorso?

+++
A partire dalla versione di settembre 2024, è possibile personalizzare il nome della cartella e persino utilizzare / per esportare i file per tutti i set di dati nella stessa cartella. Adobe Questo non è consigliato per le destinazioni che esportano più set di dati, in quanto i nomi di file generati dal sistema che appartengono a set di dati diversi verranno combinati nella stessa cartella.
+++

È possibile indirizzare il file manifesto a una cartella e i file di dati a un'altra cartella?

+++
No, non è possibile copiare il file manifesto in una posizione diversa.
+++

È possibile controllare la sequenza o la tempistica di consegna dei file?

+++
Sono disponibili opzioni per pianificare l’esportazione. Non sono disponibili opzioni per ritardare o sequenziare la copia dei file. Vengono copiati nel percorso di archiviazione non appena vengono generati.
+++

Quali formati sono disponibili per il file manifesto?

+++
Il file manifesto è in formato .json.
+++

Esiste disponibilità API per il file manifesto?

+++
Non è disponibile alcuna API per il file manifesto, ma include un elenco di file che comprendono l’esportazione.
+++

È possibile aggiungere ulteriori dettagli al file manifesto (ad esempio, il numero di record)? In caso affermativo, in che modo?

+++
Non è possibile aggiungere ulteriori informazioni al file manifesto. Il conteggio dei record è disponibile tramite l'entità flowRun (interrogabile tramite API). Ulteriori informazioni nel monitoraggio delle destinazioni.
+++

Come vengono suddivisi i file di dati? Quanti record per file?

+++
I file di dati vengono suddivisi in base al partizionamento predefinito nel data lake di Experience Platform. I set di dati più grandi hanno un numero più elevato di partizioni. Il partizionamento predefinito non è configurabile dall'utente in quanto è ottimizzato per la lettura.
+++

È possibile impostare una soglia (numero di record per file)?

+++
No, non è possibile.
+++

Come si invia di nuovo un set di dati nel caso in cui l'invio iniziale non sia valido?

+++
I tentativi vengono eseguiti automaticamente per la maggior parte dei tipi di errori di sistema.
+++

recommendation-more-help
7f4d1967-bf93-4dba-9789-bb6b505339d6