Configurare un flusso di dati per una connessione batch di archiviazione cloud nell’interfaccia utente

Un flusso di dati è un’attività pianificata che recupera e acquisisce dati da un’origine a un set di dati Platform. Questa esercitazione fornisce i passaggi per configurare un nuovo flusso di dati utilizzando l'account di archiviazione cloud.

Introduzione

Questa esercitazione richiede una buona comprensione dei seguenti componenti di Adobe Experience Platform:

  • Experience Data Model (XDM) Sistema: Il framework standardizzato in base al quale Experience Platform vengono organizzati i dati sulla customer experience.
    • Nozioni di base sulla composizione dello schema: Scopri i blocchi di base degli schemi XDM, inclusi i principi chiave e le best practice nella composizione dello schema.
    • Esercitazione dell’Editor di schema: Scopri come creare schemi personalizzati utilizzando l’interfaccia utente dell’Editor di schema.
  • Real-time Customer Profile: Fornisce un profilo di consumatore unificato e in tempo reale basato su dati aggregati provenienti da più origini.

Inoltre, questa esercitazione richiede l’utilizzo di un account di archiviazione cloud stabilito. Un elenco di esercitazioni per la creazione di diversi account di archiviazione cloud nell'interfaccia utente è disponibile nella panoramica dei connettori sorgente.

Formati di file supportati

Experience Platform supporta i seguenti formati di file da acquisire da archivi esterni:

  • Valori separati da delimitatore (DSV): Qualsiasi valore a carattere singolo può essere utilizzato come delimitatore per i file di dati in formato DSV.
  • JavaScript Object Notation (JSON): I file di dati in formato JSON devono essere conformi a XDM.
  • Apache Parquet: I file di dati in formato parquet devono essere conformi a XDM.
  • File compressi: I file JSON e delimitati possono essere compressi come segue: bzip2, gzip, deflate, zipDeflate, tarGzip e tar.

Seleziona dati

Dopo aver creato l'account di archiviazione cloud, viene visualizzato il passaggio Seleziona dati , che fornisce un'interfaccia per esplorare la gerarchia dei file di archiviazione cloud.

  • La parte sinistra dell'interfaccia è un browser delle directory, che visualizza i file e le directory di archiviazione cloud.
  • La parte destra dell’interfaccia ti consente di visualizzare in anteprima fino a 100 righe di dati da un file compatibile.

interfaccia

Selezionando una cartella elencata è possibile scorrere la gerarchia delle cartelle in cartelle più profonde. È possibile selezionare una singola cartella per acquisire tutti i file presenti nella cartella in modo ricorsivo. Quando si acquisisce un'intera cartella, è necessario assicurarsi che tutti i file presenti nella cartella condividano lo stesso schema.

Dopo aver selezionato un file o una cartella compatibile, selezionare il formato di dati corrispondente dal menu a discesa Seleziona formato dati.

Nella tabella seguente viene visualizzato il formato dati appropriato per i tipi di file supportati:

Tipo di file Formato dati
CSV Delimitato
JSON JSON
Parquet Parquet XDM

Seleziona JSON e attendi alcuni secondi per la compilazione dell'interfaccia di anteprima.

select-data

NOTA

A differenza dei tipi di file delimitati e JSON, i file in formato Parquet non sono disponibili per l’anteprima.

L’interfaccia di anteprima ti consente di esaminare il contenuto e la struttura di un file. Per impostazione predefinita, l’interfaccia di anteprima visualizza il primo file nella cartella selezionata.

Per visualizzare un’anteprima di un file diverso, seleziona l’icona di anteprima accanto al nome del file da esaminare.

anteprima predefinita

Dopo aver esaminato il contenuto e la struttura dei file nella cartella, seleziona Avanti per acquisire tutti i file nella cartella in modo ricorsivo.

select-folder

Se preferisci selezionare un file specifico, seleziona il file da acquisire, quindi seleziona Avanti.

file di selezione

Impostare un delimitatore personalizzato per i file delimitati

È possibile impostare un delimitatore personalizzato durante l’acquisizione di file delimitati. Selezionare l'opzione Delimitatore, quindi selezionare un delimitatore dal menu a discesa. Il menu visualizza le opzioni utilizzate più frequentemente per i delimitatori, tra cui una virgola (,), una scheda (\t) e una barra verticale (|). Se preferisci utilizzare un delimitatore personalizzato, seleziona Personalizzato e immetti un delimitatore a carattere singolo nella barra di input a comparsa.

Dopo aver selezionato il formato dei dati e impostato il delimitatore, selezionare Avanti.

Inserire file compressi

È possibile acquisire file JSON compressi o delimitati specificandone il tipo di compressione.

Nel passaggio Seleziona dati, seleziona un file compresso da acquisire, quindi seleziona il tipo di file appropriato e se è conforme o meno a XDM. Quindi, selezionare Tipo di compressione, quindi selezionare il tipo di file compresso appropriato per i dati di origine.

Con un tipo di file compresso identificato, selezionare Avanti per continuare.

Mappatura di campi dati su uno schema XDM

Viene visualizzato il passaggio Mapping , che fornisce un'interfaccia interattiva per mappare i dati di origine a un set di dati Platform. I file di origine formattati in Parquet devono essere conformi a XDM e non richiedono la configurazione manuale della mappatura, mentre i file CSV richiedono la configurazione esplicita della mappatura, ma consentono di scegliere quali campi di dati di origine mappare. I file JSON, se contrassegnati come reclamo XDM, non richiedono la configurazione manuale. Tuttavia, se non è contrassegnato come conforme a XDM, sarà necessario configurare esplicitamente la mappatura.

Scegli un set di dati in entrata in cui acquisire i dati. Puoi utilizzare un set di dati esistente o crearne uno nuovo.

Utilizzare un set di dati esistente

Per acquisire i dati in un set di dati esistente, seleziona Set di dati esistente, quindi seleziona l’icona del set di dati.

Viene visualizzata la finestra di dialogo Seleziona set di dati . Trova il set di dati che desideri utilizzare, selezionalo, quindi fai clic su Continua.

Utilizzare un nuovo set di dati

Per acquisire i dati in un nuovo set di dati, seleziona Nuovo set di dati e inserisci un nome e una descrizione per il set di dati nei campi forniti. Per aggiungere uno schema, è possibile immettere un nome di schema esistente nella finestra di dialogo Seleziona schema. In alternativa, è possibile selezionare la Ricerca avanzata schema per cercare uno schema appropriato.

Durante questo passaggio, puoi abilitare il set di dati per Real-time Customer Profile e creare una visualizzazione olistica degli attributi e dei comportamenti di un’entità. I dati di tutti i set di dati abilitati verranno inclusi in Profile e le modifiche vengono applicate al salvataggio del flusso di dati.

Attiva il pulsante Set di dati di profilo per abilitare il set di dati di destinazione per Profile.

Viene visualizzata la finestra di dialogo Seleziona schema. Seleziona lo schema da applicare al nuovo set di dati, quindi seleziona Fine.

In base alle tue esigenze, puoi scegliere di mappare direttamente i campi oppure utilizzare le funzioni di preparazione dei dati per trasformare i dati di origine in valori calcolati o calcolati. Per ulteriori informazioni sulle funzioni di mappatura e sui campi calcolati, consulta la Guida alle funzioni di preparazione dei dati o la guida ai campi calcolati.

Per i file JSON, oltre a mappare direttamente i campi su altri campi, è possibile mappare direttamente gli oggetti su altri oggetti e array su altri array. È inoltre possibile visualizzare in anteprima e mappare tipi di dati complessi, ad esempio gli array in file JSON, utilizzando un connettore di origine dell'archiviazione cloud.

Non è possibile eseguire la mappatura tra tipi diversi. Ad esempio, non è possibile associare un oggetto a una matrice o un campo a un oggetto.

SUGGERIMENTO

Platform fornisce consigli intelligenti per i campi mappati automaticamente in base allo schema o al set di dati di destinazione selezionato. Puoi regolare manualmente le regole di mappatura in base ai tuoi casi d’uso.

Seleziona Anteprima dati per visualizzare i risultati della mappatura di fino a 100 righe di dati di esempio dal set di dati selezionato.

Durante l’anteprima, la colonna Identity ha la priorità come primo campo, in quanto rappresenta le informazioni chiave necessarie per la convalida dei risultati della mappatura.

Una volta mappati i dati di origine, seleziona Chiudi.

Pianifica esecuzioni di acquisizione

Viene visualizzato il passaggio Pianificazione , che consente di configurare una pianificazione dell’acquisizione per acquisire automaticamente i dati di origine selezionati utilizzando le mappature configurate. La tabella seguente illustra i diversi campi configurabili per la pianificazione:

Campo Descrizione
Frequenza Le frequenze selezionabili sono Once, Minute, Hour, Day e Week.
Intervallo Un numero intero che imposta l'intervallo per la frequenza selezionata.
Ora di inizio Una marca temporale UTC che indica quando è impostata la prima acquisizione.
Backfill Un valore booleano che determina i dati inizialmente acquisiti. Se è abilitato Backfill, tutti i file correnti nel percorso specificato verranno acquisiti durante la prima acquisizione pianificata. Se Backfill è disattivato, verranno acquisiti solo i file caricati tra la prima esecuzione dell’acquisizione e l’ora di inizio. I file caricati prima dell’ora di inizio non vengono acquisiti.

I flussi di dati sono progettati per acquisire automaticamente i dati su base pianificata. Inizia selezionando la frequenza di acquisizione. Quindi, impostare l'intervallo per indicare il periodo tra due esecuzioni di flusso. Il valore dell'intervallo deve essere un numero intero diverso da zero e deve essere impostato su maggiore o uguale a 15.

Per impostare l’ora di inizio per l’acquisizione, regola la data e l’ora visualizzate nella casella dell’ora di inizio. In alternativa, puoi selezionare l’icona del calendario per modificare il valore dell’ora di inizio. L'ora di inizio deve essere maggiore o uguale all'ora corrente in UTC.

Immetti i valori per la pianificazione e seleziona Avanti.

Configurare un flusso di dati di acquisizione una tantum

Per impostare l’acquisizione una tantum, seleziona la freccia a discesa della frequenza e seleziona Una volta. Puoi continuare a apportare modifiche a un set di flussi di dati per un’acquisizione di frequenza una tantum, purché l’ora di inizio rimanga in futuro. Una volta trascorso l’orario di inizio, il valore della frequenza una tantum non può più essere modificato. ​Intervaland ​Backfillare non sono visibili quando si imposta un flusso di dati di acquisizione una tantum.

IMPORTANTE

Si consiglia vivamente di pianificare il flusso di dati per l’inserimento una tantum quando si utilizza il connettore FTP.

Dopo aver fornito i valori appropriati alla pianificazione, selezionare Avanti.

Fornire i dettagli del flusso di dati

Viene visualizzato il passaggio Dettaglio flusso di dati , che consente di assegnare un nome e una breve descrizione del nuovo flusso di dati.

Durante questo processo, puoi anche abilitare Acquisizione parziale e Diagnostica errori. L’abilitazione di Acquisizione parziale consente di acquisire dati contenenti errori, fino a una determinata soglia che è possibile impostare. L'abilitazione di Diagnostica errori fornirà dettagli su tutti i dati errati che vengono forniti separatamente in batch. Per ulteriori informazioni, consulta la panoramica sull’acquisizione parziale dei batch.

Immetti i valori per il flusso di dati e seleziona Avanti.

Controlla il tuo flusso di dati

Viene visualizzato il passaggio Rivedi, che consente di rivedere il nuovo flusso di dati prima della creazione. I dettagli sono raggruppati nelle seguenti categorie:

  • Connessione: Mostra il tipo di origine, il percorso pertinente del file di origine scelto e la quantità di colonne all'interno del file di origine.
  • Assegna set di dati e campi mappa: Mostra il set di dati in cui vengono acquisiti i dati di origine, incluso lo schema a cui il set di dati aderisce.
  • Pianificazione: Mostra il periodo, la frequenza e l’intervallo attivi della pianificazione dell’acquisizione.

Dopo aver esaminato il flusso di dati, fai clic su Fine e consenti la creazione del flusso di dati.

Monitorare il flusso di dati

Una volta creato il flusso di dati, puoi monitorare i dati che vengono acquisiti tramite di esso per visualizzare informazioni sui tassi di acquisizione, sul successo e sugli errori. Per ulteriori informazioni su come monitorare il flusso di dati, consulta l’esercitazione su monitoraggio di account e flussi di dati nell’interfaccia utente.

Elimina il flusso di dati

È possibile eliminare i flussi di dati che non sono più necessari o che sono stati creati in modo errato utilizzando la funzione Elimina disponibile nell'area di lavoro Dataflows. Per ulteriori informazioni su come eliminare i flussi di dati, consulta l’esercitazione sull’ eliminazione dei flussi di dati nell’interfaccia utente.

Passaggi successivi

Seguendo questa esercitazione, hai creato correttamente un flusso di dati per inserire dati da un archivio cloud esterno e hai acquisito informazioni sul monitoraggio dei set di dati. Per ulteriori informazioni sulla creazione di flussi di dati, è possibile completare l'apprendimento guardando il video sottostante. Inoltre, i dati in arrivo possono ora essere utilizzati dai servizi a valle Platform come Real-time Customer Profile e Data Science Workspace. Per ulteriori informazioni, consulta i seguenti documenti:

AVVERTENZA

L’ Platform interfaccia utente mostrata nel video seguente è obsoleta. Fai riferimento alla documentazione precedente per le ultime schermate e funzionalità dell’interfaccia utente.

Appendice

Le sezioni seguenti forniscono informazioni aggiuntive per l’utilizzo dei connettori sorgente.

Disattiva un flusso di dati

Quando un flusso di dati viene creato, diventa immediatamente attivo e acquisisce i dati in base alla pianificazione specificata. Puoi disattivare un flusso di dati attivo in qualsiasi momento seguendo le istruzioni riportate di seguito.

Nell'area di lavoro Origini fare clic sulla scheda Sfoglia. Quindi, fai clic sul nome dell'account associato al flusso di dati attivo che desideri disattivare.

Viene visualizzata la pagina Attività sorgente . Seleziona il flusso di dati attivo dall’elenco per aprire la relativa colonna Proprietà sul lato destro dello schermo, che contiene un pulsante di attivazione/disattivazione Attivato. Fai clic sull’interruttore per disattivare il flusso di dati. La stessa opzione può essere utilizzata per riattivare un flusso di dati dopo che è stato disabilitato.

Attivare i dati in entrata per la popolazione Profile

I dati in entrata provenienti dal connettore di origine possono essere utilizzati per arricchire e popolare i dati Real-time Customer Profile. Per ulteriori informazioni sulla compilazione dei dati Real-time Customer Profile, consulta l’esercitazione su Popolazione di profili.

In questa pagina