Creare un flusso di dati utilizzando un’origine di database nell’interfaccia utente

Un flusso di dati è un’attività pianificata che recupera e acquisisce dati da un’origine a un set di dati in Adobe Experience Platform. Questo tutorial illustra come creare un flusso di dati per un’origine di database utilizzando l’interfaccia utente di Platform.

NOTE
  • Per creare un flusso di dati, è necessario disporre già di un account autenticato con un’origine di database. Un elenco di esercitazioni per la creazione di diversi account di origine del database nell'interfaccia utente è disponibile nella panoramica sulle origini.

  • Ad Experience Platform, per acquisire i dati, i fusi orari per tutte le origini batch basate su tabelle devono essere configurati in formato UTC. L'unico indicatore orario supportato per l'Snowflake origine è TIMESTAMP_NTZ con ora UTC.

Introduzione

Questo tutorial richiede una buona conoscenza dei seguenti componenti di Platform:

  • Origini: Platform consente di acquisire dati da varie origini e allo stesso tempo di strutturare, etichettare e migliorare i dati in arrivo tramite i servizi Platform.

  • Experience Data Model (XDM) Sistema: framework standardizzato in base al quale Experience Platform organizza i dati sull'esperienza del cliente.

  • Real-Time Customer Profile: fornisce un profilo consumer unificato e in tempo reale basato su dati aggregati provenienti da più origini.

  • Data Prep: consente ai data engineer di mappare, trasformare e convalidare i dati da e verso Experience Data Model (XDM).

Aggiungi dati

Dopo aver creato l'account di origine del database, viene visualizzato il passaggio Aggiungi dati che fornisce un'interfaccia per esplorare la gerarchia delle tabelle dell'account di origine del database.

  • La metà sinistra dell’interfaccia è un browser che visualizza un elenco di tabelle di dati contenute nell’account. L’interfaccia include anche un’opzione di ricerca che consente di identificare rapidamente i dati di origine che intendi utilizzare.
  • La metà destra dell’interfaccia è un pannello di anteprima che consente di visualizzare fino a 100 righe di dati in anteprima.
NOTE
L'opzione di ricerca dei dati di origine è disponibile per tutte le origini basate su tabelle ad eccezione di Adobe Analytics, Amazon Kinesis e Azure Event Hubs.

Una volta trovati i dati di origine, selezionare la tabella, quindi selezionare Avanti.

select-data

Fornisci i dettagli del flusso di dati

La pagina Dettagli flusso di dati consente di scegliere se utilizzare un set di dati esistente o nuovo. Durante questo processo, puoi anche configurare le impostazioni per Set di dati profilo, Diagnostica errori, Acquisizione parziale e Avvisi.

dettagli flusso di dati

Usa un set di dati esistente

Per acquisire dati in un set di dati esistente, seleziona Set di dati esistente. Puoi recuperare un set di dati esistente utilizzando l'opzione Ricerca avanzata oppure scorrendo l'elenco dei set di dati esistenti nel menu a discesa. Dopo aver selezionato un set di dati, fornisci un nome e una descrizione per il flusso di dati.

set di dati esistente

Utilizza un nuovo set di dati

Per acquisire in un nuovo set di dati, seleziona Nuovo set di dati, quindi fornisci un nome per il set di dati di output e una descrizione facoltativa. Quindi, seleziona uno schema a cui mappare utilizzando l'opzione Ricerca avanzata o scorrendo l'elenco degli schemi esistenti nel menu a discesa. Dopo aver selezionato uno schema, fornisci un nome e una descrizione per il flusso di dati.

nuovo-set di dati

Abilita Profile e diagnostica errori

Quindi, seleziona il Set di dati profilo per abilitare il set di dati per Profile. Questo consente di creare una vista olistica degli attributi e dei comportamenti di un’entità. I dati di tutti i set di dati abilitati per Profile verranno inclusi in Profile e le modifiche verranno applicate al momento del salvataggio del flusso di dati.

Diagnostica errori consente la generazione di messaggi di errore dettagliati per eventuali record errati che si verificano nel flusso di dati, mentre L'acquisizione parziale consente di acquisire dati contenenti errori, fino a una determinata soglia definita manualmente. Per ulteriori informazioni, consulta la panoramica sull'acquisizione batch parziale.

profile-and-errors

Abilita avvisi

Puoi abilitare gli avvisi per ricevere notifiche sullo stato del flusso di dati. Seleziona un avviso dall’elenco per abbonarti e ricevere notifiche sullo stato del flusso di dati. Per ulteriori informazioni sugli avvisi, consulta la guida su abbonamento agli avvisi di origini tramite l'interfaccia utente.

Dopo aver fornito i dettagli al flusso di dati, seleziona Avanti.

avvisi

Mappare i campi dati su uno schema XDM

Viene visualizzato il passaggio Mappatura che fornisce un'interfaccia per mappare i campi sorgente dallo schema sorgente ai campi XDM di destinazione appropriati nello schema di destinazione.

Platform fornisce consigli intelligenti per campi mappati automaticamente in base allo schema o al set di dati di destinazione selezionato. Puoi regolare manualmente le regole di mappatura in base ai tuoi casi d’uso. In base alle tue esigenze, puoi scegliere di mappare i campi direttamente o utilizzare le funzioni di preparazione dati per trasformare i dati sorgente in modo da derivare valori calcolati o calcolati. Per i passaggi completi sull'utilizzo dell'interfaccia mapper e dei campi calcolati, consulta la guida dell'interfaccia utente della preparazione dati.

Una volta mappati correttamente i dati di origine, seleziona Avanti.

mappatura

Pianificazione esecuzioni dell’acquisizione

Viene visualizzato il passaggio Pianificazione, che consente di configurare una pianificazione di acquisizione per acquisire automaticamente i dati di origine selezionati utilizzando le mappature configurate. Per impostazione predefinita, la pianificazione è impostata su Once. Per regolare la frequenza di acquisizione, seleziona Frequenza, quindi scegli un'opzione dal menu a discesa.

TIP
L’intervallo e la retrocompilazione non sono visibili durante un’acquisizione una tantum.

pianificazione

Se imposti la frequenza di acquisizione su Minute, Hour, Day o Week, devi impostare un intervallo per stabilire un intervallo di tempo impostato tra ogni acquisizione. Ad esempio, se la frequenza di acquisizione è impostata su Day e l'intervallo è impostato su 15, il flusso di dati verrà pianificato in modo da acquisire i dati ogni 15 giorni.

Durante questo passaggio, puoi anche abilitare backfill e definire una colonna per l'acquisizione incrementale dei dati. La retrocompilazione viene utilizzata per acquisire i dati storici, mentre la colonna definita per l’acquisizione incrementale consente di distinguere i nuovi dati dai dati esistenti.

Per ulteriori informazioni sulle configurazioni di pianificazione, consulta la tabella seguente.

Campo
Descrizione
Frequenza
La frequenza con cui si verifica un’acquisizione. Le frequenze selezionabili sono Once, Minute, Hour, Day e Week.
Intervallo
Numero intero che imposta l'intervallo per la frequenza selezionata. Il valore dell'intervallo deve essere un numero intero diverso da zero e deve essere impostato su un valore maggiore o uguale a 15.
Ora di inizio
Una marca temporale UTC che indica quando è impostata per avvenire la prima acquisizione. L’ora di inizio deve essere maggiore o uguale all’ora UTC corrente.
Retrocompilazione
Valore booleano che determina quali dati vengono inizialmente acquisiti. Se la retrocompilazione è abilitata, tutti i file correnti nel percorso specificato verranno acquisiti durante la prima acquisizione pianificata. Se la retrocompilazione è disattivata, verranno acquisiti solo i file caricati tra la prima esecuzione dell’acquisizione e l’ora di inizio. I file caricati prima dell’ora di avvio non verranno acquisiti.
Carica dati incrementali per
Opzione con un set filtrato di campi dello schema di origine di tipo, data o ora. Per caricare correttamente i dati incrementali, il campo selezionato per Carica dati incrementali da deve avere i valori data-ora nel fuso orario UTC. Tutte le origini batch basate su tabelle selezionano i dati incrementali confrontando un valore di timestamp della colonna delta con il tempo UTC della finestra di esecuzione del flusso corrispondente e quindi copiando i dati dall'origine, se vengono trovati nuovi dati all'interno della finestra di tempo UTC.

backfill

Verifica il flusso di dati

Viene visualizzato il passaggio Rivedi, che consente di rivedere il nuovo flusso di dati prima che venga creato. I dettagli sono raggruppati nelle seguenti categorie:

  • Connessione: mostra il tipo di origine, il percorso pertinente del file di origine scelto e la quantità di colonne all'interno di tale file di origine.
  • Assegna set di dati e mappa i campi: mostra in quale set di dati vengono acquisiti i dati di origine, incluso lo schema a cui il set di dati aderisce.
  • Pianificazione: mostra il periodo, la frequenza e l'intervallo attivi della pianificazione di acquisizione.

Dopo aver rivisto il flusso di dati, seleziona Fine e attendi che venga creato un po' di tempo.

revisione

Monitorare il flusso di dati

Una volta creato il flusso di dati, puoi monitorare i dati che vengono acquisiti tramite di esso per visualizzare informazioni su tassi di acquisizione, successo ed errori. Per ulteriori informazioni su come monitorare il flusso di dati, consulta l'esercitazione su account di monitoraggio e flussi di dati nell'interfaccia utente.

Eliminare il flusso di dati

È possibile eliminare i flussi di dati non più necessari o creati in modo errato utilizzando la funzione Elimina disponibile nell'area di lavoro Flussi di dati. Per ulteriori informazioni su come eliminare i flussi di dati, vedere l'esercitazione sull'eliminazione di flussi di dati nell'interfaccia utente.

Passaggi successivi

Seguendo questa esercitazione, hai creato correttamente un flusso di dati per portare i dati dall’origine del database a Platform. I dati in arrivo possono ora essere utilizzati da servizi Platform downstream come Real-Time Customer Profile e Data Science Workspace. Per ulteriori informazioni, consulta i seguenti documenti:

recommendation-more-help
337b99bb-92fb-42ae-b6b7-c7042161d089