Esportare i set di dati nelle destinazioni dell’archiviazione cloud
- Questa funzionalità è disponibile per i clienti che hanno acquistato il pacchetto Real-Time CDP Prime o Ultimate, Adobe Journey Optimizer o il Customer Journey Analytics. Per ulteriori informazioni, contatta il rappresentante Adobe.
In questo articolo viene illustrato il flusso di lavoro necessario per esportare set di dati da Adobe Experience Platform nel percorso di archiviazione cloud preferito, ad esempio Amazon S3, percorsi SFTP o Google Cloud Storage tramite l'interfaccia utente di Experience Platform.
Puoi anche utilizzare le API Experience Platform per esportare i set di dati. Per ulteriori informazioni, consulta l'esercitazione sull'esportazione di dataset API.
Set di dati disponibili per l’esportazione datasets-to-export
I set di dati che puoi esportare variano in base all’applicazione di Experience Platform (Real-Time CDP, Adobe Journey Optimizer), al livello (Prime o Ultimate) ed eventuali componenti aggiuntivi acquistati (ad esempio, Data Distiller).
Utilizza la tabella seguente per capire quali tipi di set di dati puoi esportare in base all’applicazione, al livello di prodotto ed eventuali componenti aggiuntivi acquistati:
- Set di dati di profili ed eventi di esperienza creati nell’interfaccia utente di Experience Platform dopo l’acquisizione o la raccolta di dati tramite Sources, Web SDK, Mobile SDK, Analytics Data Connector ed Audience Manager.
- Set di dati snapshot profilo generato dal sistema.
Esercitazione video video-tutorial
Guarda il video seguente per una spiegazione end-to-end del flusso di lavoro descritto in questa pagina, i vantaggi dell’utilizzo della funzionalità di esportazione dei set di dati e alcuni casi d’uso consigliati.
Destinazioni supportati supported-destinations
Al momento, puoi esportare i set di dati nelle destinazioni di archiviazione cloud evidenziate nella schermata ed elencate di seguito.
Quando attivare tipi di pubblico o esportare set di dati when-to-activate-audiences-or-activate-datasets
Alcune destinazioni basate su file nel catalogo Experience Platform supportano sia l’attivazione del pubblico che l’esportazione di set di dati.
- Considera l’attivazione di tipi di pubblico quando desideri che i dati siano strutturati in profili raggruppati per interessi o qualifiche di pubblico.
- In alternativa, puoi prendere in considerazione le esportazioni di set di dati quando desideri esportare set di dati non elaborati, che non sono raggruppati o strutturati in base agli interessi o alle qualifiche del pubblico. Puoi utilizzare questi dati per reporting, flussi di lavoro sulla scienza dei dati e molti altri casi d’uso. In qualità di amministratore, ingegnere dati o analista, ad esempio, puoi esportare i dati da Experience Platform per sincronizzarli con il data warehouse, utilizzarli in strumenti di analisi BI, in strumenti di ML cloud esterni o archiviarli nel sistema per esigenze di archiviazione a lungo termine.
Questo documento contiene tutte le informazioni necessarie per esportare i set di dati. Se desideri attivare tipi di pubblico nell'archiviazione cloud o nelle destinazioni di e-mail marketing, leggi Attiva dati pubblico nelle destinazioni di esportazione del profilo batch.
Prerequisiti prerequisites
Per esportare i set di dati nelle destinazioni dell'archiviazione cloud, è necessario avere connesso a una destinazione. Se non lo hai già fatto, vai al catalogo delle destinazioni, sfoglia le destinazioni supportate e configura la destinazione che desideri utilizzare.
Autorizzazioni richieste permissions
Per esportare i set di dati, è necessario Visualizzare le destinazioni, Visualizzare i set di dati e Gestire e attivare le destinazioni dei set di dati accedere alle autorizzazioni di controllo. Leggi la panoramica sul controllo degli accessi o contatta l'amministratore del prodotto per ottenere le autorizzazioni necessarie.
Per assicurarti di disporre delle autorizzazioni necessarie per esportare i set di dati e che la destinazione supporti l’esportazione dei set di dati, sfoglia il catalogo delle destinazioni. Se una destinazione dispone di un controllo Attiva o Esporta set di dati, si dispone delle autorizzazioni appropriate.
Seleziona la destinazione select-destination
Segui le istruzioni per selezionare una destinazione in cui puoi esportare i set di dati:
-
Vai a Connessioni > Destinazioni e seleziona la scheda Catalogo.
-
Seleziona Attiva o Esporta set di dati nella scheda corrispondente alla destinazione in cui desideri esportare i set di dati.
-
Seleziona Set di dati di tipo dati e seleziona la connessione di destinazione in cui desideri esportare i set di dati, quindi seleziona Avanti.
- Viene visualizzata la visualizzazione Seleziona set di dati. Procedi alla sezione successiva per selezionare i set di dati per l'esportazione.
Seleziona i set di dati select-datasets
Utilizza le caselle di controllo a sinistra dei nomi dei set di dati per selezionare i set di dati da esportare nella destinazione, quindi seleziona Successivo.
Pianificare l’esportazione di set di dati scheduling
Utilizza il passaggio Pianificazione per:
- Imposta una data di inizio e una data di fine, nonché una cadenza di esportazione per le esportazioni dei set di dati.
- Configura se i file del set di dati esportati devono esportare l’appartenenza completa al set di dati o solo modifiche incrementali all’appartenenza a ogni occorrenza di esportazione.
- Personalizza il percorso della cartella nel percorso di archiviazione in cui devono essere esportati i set di dati. Ulteriori informazioni su come modificare il percorso della cartella di esportazione.
Utilizza il controllo Modifica pianificazione nella pagina per modificare la frequenza di esportazione delle esportazioni e per scegliere se esportare file completi o incrementali.
L'opzione Esporta file incrementali è selezionata per impostazione predefinita. Questo attiva un’esportazione di uno o più file che rappresentano un’istantanea completa del set di dati. I file successivi sono aggiunte incrementali al set di dati dall’esportazione precedente. È inoltre possibile selezionare Esporta file completi. In questo caso, seleziona la frequenza Una volta per un'esportazione completa una tantum del set di dati.
-
Utilizza il selettore Frequenza per selezionare la frequenza di esportazione:
- Giornaliero: pianifica le esportazioni di file incrementali una volta al giorno, ogni giorno, al momento specificato.
- Oraria: pianifica esportazioni di file incrementali ogni 3, 6, 8 o 12 ore.
-
Utilizza il selettore Ora per scegliere l'ora del giorno, in formato UTC, in cui eseguire l'esportazione.
-
Utilizza il selettore Data per scegliere l'intervallo in cui deve essere eseguita l'esportazione.
-
Seleziona Salva per salvare la pianificazione e procedere al passaggio Rivedi.
Modificare il percorso della cartella edit-folder-path
Seleziona Modifica percorso cartella per personalizzare la struttura delle cartelle nel percorso di archiviazione in cui vengono depositati i set di dati esportati.
È possibile utilizzare diverse macro disponibili per personalizzare il nome di una cartella desiderata. Fare doppio clic su una macro per aggiungerla al percorso della cartella e utilizzare /
tra le macro per separare le cartelle.
Dopo aver selezionato le macro desiderate, è possibile visualizzare un'anteprima della struttura di cartelle che verrà creata nel percorso di archiviazione. Il primo livello nella struttura delle cartelle rappresenta il percorso cartella indicato quando si è connessi alla destinazione per esportare i set di dati.
Controlla review
Nella pagina Rivedi puoi visualizzare un riepilogo della selezione. Seleziona Annulla per interrompere il flusso, Indietro per modificare le impostazioni oppure Fine per confermare la selezione e iniziare a esportare i set di dati nella destinazione.
Verificare l’esportazione del set di dati verify
Durante l'esportazione dei set di dati, Experience Platform crea uno o più file .json
o .parquet
nel percorso di archiviazione fornito. I nuovi file verranno archiviati nel percorso di archiviazione in base alla pianificazione di esportazione fornita.
In Experience Platform viene creata una struttura di cartelle nel percorso di archiviazione specificato, in cui vengono depositati i file del set di dati esportati. Il modello di esportazione delle cartelle predefinito è illustrato di seguito, ma è possibile personalizzare la struttura delle cartelle con le macro preferite.
folder-name-you-provided
- rappresenta il percorso cartella che hai indicato quando ti sei connesso alla destinazione per esportare i set di dati.folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
Il nome di file predefinito viene generato in modo casuale e garantisce che i nomi di file esportati siano univoci.
File di set di dati di esempio sample-files
La presenza di questi file nel percorso di archiviazione conferma la riuscita dell’esportazione. Per comprendere la struttura dei file esportati, è possibile scaricare un file .parquet di esempio o .json.
File di set di dati compressi compressed-dataset-files
Nel flusso di lavoro connetti a destinazione, è possibile selezionare i file del set di dati esportati da comprimere, come illustrato di seguito:
Quando vengono compressi, si noti la differenza di formato tra i due tipi di file:
- Durante l'esportazione di file JSON compressi, il formato del file esportato è
json.gz
. Il formato del JSON esportato è NDJSON, che è il formato di interscambio standard nell'ecosistema dei big data. Adobe consiglia di utilizzare un client compatibile con NDJSON per leggere i file esportati. - Durante l'esportazione di file parquet compressi, il formato del file esportato è
gz.parquet
Le esportazioni in file JSON sono supportate solo in modalità compressa. Le esportazioni in file Parquet sono supportate in modalità compressa e non compressa.
Rimuovere i set di dati dalle destinazioni remove-dataset
Per rimuovere i set di dati da un flusso di dati esistente, effettua le seguenti operazioni:
-
Accedi a interfaccia utente Experience Platform e seleziona Destinazioni dalla barra di navigazione a sinistra. Seleziona Sfoglia dall'intestazione superiore per visualizzare i flussi di dati di destinazione esistenti.
note tip TIP Seleziona l'icona del filtro in alto a sinistra per avviare il pannello di ordinamento. Il pannello Ordinamento fornisce un elenco di tutte le destinazioni. Puoi selezionare più di una destinazione dall’elenco per visualizzare una selezione filtrata di flussi di dati associati alla destinazione selezionata. -
Dalla colonna Dati attivazione, seleziona il controllo Set di dati per visualizzare tutti i set di dati mappati a questo flusso di dati di esportazione.
-
Viene visualizzata la pagina Dati attivazione per la destinazione. Utilizza le caselle di controllo a sinistra dell'elenco dei set di dati per selezionare i set di dati da rimuovere, quindi seleziona Rimuovi set di dati nella barra a destra per attivare la finestra di dialogo di conferma della rimozione dei set di dati.
-
Nella finestra di dialogo di conferma, seleziona Rimuovi per rimuovere immediatamente il set di dati dalle esportazioni nella destinazione.
Diritti di esportazione del set di dati licensing-entitlement
Consulta i documenti di descrizione del prodotto per capire la quantità di dati che hai diritto di esportare per ogni applicazione di Experience Platform all’anno. Ad esempio, puoi visualizzare la descrizione del prodotto Real-Time CDP qui.
I diritti all’esportazione di dati per diverse applicazioni non sono additivi. Ciò significa, ad esempio, che se acquisti Real-Time CDP Ultimate e Adobe Journey Optimizer Ultimate, il diritto all’esportazione del profilo sarà il più grande tra i due diritti, in base alle descrizioni del prodotto. Il volume di adesioni viene calcolato moltiplicando il numero totale di profili con licenza per 500 KB per Real-Time CDP Prime o 700 KB per Real-Time CDP Ultimate per determinare il volume di dati a cui hai diritto.
Se invece sono stati acquistati componenti aggiuntivi come Data Distiller, il limite di esportazione dei dati a cui hai diritto rappresenta la somma del livello prodotto e del componente aggiuntivo.
Puoi visualizzare e tenere traccia delle esportazioni dei profili rispetto ai limiti contrattuali nel dashboard utilizzo licenze.
Limitazioni note known-limitations
Tieni presente le seguenti limitazioni per il rilascio di disponibilità generale delle esportazioni di set di dati:
- Attualmente, è possibile esportare solo file incrementali e non è possibile selezionare una data di fine per le esportazioni dei set di dati.
- Experience Platform può esportare più file anche per set di dati di piccole dimensioni. L’esportazione dei set di dati è progettata per l’integrazione tra sistemi e ottimizzata per le prestazioni, pertanto il numero di file esportati non è personalizzabile.
- I nomi di file esportati non sono attualmente personalizzabili.
- I set di dati creati tramite API non sono attualmente disponibili per l’esportazione.
- L’interfaccia utente non ti blocca attualmente l’eliminazione di un set di dati in fase di esportazione in una destinazione. Non eliminare i set di dati da esportare nelle destinazioni. Rimuovere il set di dati da un flusso di dati di destinazione prima di eliminarlo.
- Le metriche di monitoraggio per le esportazioni di set di dati sono attualmente combinate con i numeri per le esportazioni di profili, pertanto non riflettono i numeri di esportazione effettivi.
- I dati con una marca temporale precedente ai 365 giorni sono esclusi dalle esportazioni dei set di dati. Per ulteriori informazioni, visualizza guardrail per esportazioni di set di dati pianificate
Domande frequenti faq
È possibile generare un file senza una cartella se si salva solo in /
come percorso della cartella? Inoltre, se non è necessario un percorso di cartella, in che modo verranno generati i file con nomi duplicati in una cartella o in un percorso?
+++
A partire dalla versione di settembre 2024, è possibile personalizzare il nome della cartella e persino utilizzare /
per esportare i file per tutti i set di dati nella stessa cartella. Adobe Questo non è consigliato per le destinazioni che esportano più set di dati, in quanto i nomi di file generati dal sistema che appartengono a set di dati diversi verranno combinati nella stessa cartella.
+++
È possibile indirizzare il file manifesto a una cartella e i file di dati a un'altra cartella?
+++
No, non è possibile copiare il file manifesto in una posizione diversa.
+++
È possibile controllare la sequenza o la tempistica di consegna dei file?
+++
Sono disponibili opzioni per pianificare l’esportazione. Non sono disponibili opzioni per ritardare o sequenziare la copia dei file. Vengono copiati nel percorso di archiviazione non appena vengono generati.
+++
Quali formati sono disponibili per il file manifesto?
+++
Il file manifesto è in formato .json.
+++
Esiste disponibilità API per il file manifesto?
+++
Non è disponibile alcuna API per il file manifesto, ma include un elenco di file che comprendono l’esportazione.
+++
È possibile aggiungere ulteriori dettagli al file manifesto (ad esempio, il numero di record)? In caso affermativo, in che modo?
+++
Non è possibile aggiungere ulteriori informazioni al file manifesto. Il conteggio dei record è disponibile tramite l'entità flowRun
(interrogabile tramite API). Ulteriori informazioni nel monitoraggio delle destinazioni.
+++
Come vengono suddivisi i file di dati? Quanti record per file?
+++
I file di dati vengono suddivisi in base al partizionamento predefinito nel data lake di Experience Platform. I set di dati più grandi hanno un numero più elevato di partizioni. Il partizionamento predefinito non è configurabile dall'utente in quanto è ottimizzato per la lettura.
+++
È possibile impostare una soglia (numero di record per file)?
+++
No, non è possibile.
+++
Come si invia di nuovo un set di dati nel caso in cui l'invio iniziale non sia valido?
+++
I tentativi vengono eseguiti automaticamente per la maggior parte dei tipi di errori di sistema.
+++