Creare un flusso di dati utilizzando un’origine di database nell’interfaccia utente
Un flusso di dati è un’attività pianificata che recupera e acquisisce dati da un’origine a un set di dati in Adobe Experience Platform. Questo tutorial illustra come creare un flusso di dati per un’origine di database utilizzando l’interfaccia utente di Experience Platform.
-
Per creare un flusso di dati, è necessario disporre già di un account autenticato con un’origine di database. Un elenco di esercitazioni per la creazione di diversi account di origine del database nell'interfaccia utente è disponibile nella panoramica sulle origini.
-
Affinché Experience Platform possa acquisire i dati, i fusi orari per tutte le origini batch basate su tabelle devono essere configurati in formato UTC. L'unico indicatore orario supportato per l'Snowflake origine è TIMESTAMP_NTZ con ora UTC.
Introduzione
Questo tutorial richiede una buona conoscenza dei seguenti componenti di Experience Platform:
-
Origini: Experience Platform consente di acquisire dati da varie origini e allo stesso tempo di strutturare, etichettare e migliorare i dati in arrivo tramite i servizi Experience Platform.
-
Experience Data Model (XDM) Sistema: framework standardizzato tramite il quale Experience Platform organizza i dati sull'esperienza del cliente.
- Nozioni di base sulla composizione dello schema: scopri i blocchi predefiniti di base degli schemi XDM, inclusi i principi chiave e le best practice nella composizione dello schema.
- Esercitazione sull'editor di schemi: scopri come creare schemi personalizzati utilizzando l'interfaccia utente dell'editor di schemi.
-
Real-Time Customer Profile: fornisce un profilo consumer unificato e in tempo reale basato su dati aggregati provenienti da più origini.
-
Data Prep: consente ai data engineer di mappare, trasformare e convalidare i dati da e verso Experience Data Model (XDM).
Aggiungi dati
Dopo aver creato l'account di origine del database, viene visualizzato il passaggio Add data che fornisce un'interfaccia per esplorare la gerarchia delle tabelle dell'account di origine del database.
- La metà sinistra dell’interfaccia è un browser che visualizza un elenco di tabelle di dati contenute nell’account. L’interfaccia include anche un’opzione di ricerca che consente di identificare rapidamente i dati di origine che intendi utilizzare.
- La metà destra dell’interfaccia è un pannello di anteprima che consente di visualizzare fino a 100 righe di dati in anteprima.
Una volta trovati i dati di origine, selezionare la tabella, quindi selezionare Next.
Fornisci i dettagli del flusso di dati
La pagina Dataflow detail consente di scegliere se utilizzare un set di dati esistente o nuovo. Durante questo processo è inoltre possibile configurare le impostazioni per Profile dataset, Error diagnostics, Partial ingestion e Alerts.
Usa un set di dati esistente
Per acquisire dati in un set di dati esistente, selezionare Existing dataset. È possibile recuperare un set di dati esistente utilizzando l'opzione Advanced search oppure scorrendo l'elenco dei set di dati esistenti nel menu a discesa. Dopo aver selezionato un set di dati, fornisci un nome e una descrizione per il flusso di dati.
Utilizza un nuovo set di dati
Per acquisire in un nuovo set di dati, selezionare New dataset, quindi fornire un nome per il set di dati di output e una descrizione facoltativa. Quindi, selezionare uno schema a cui mappare utilizzando l'opzione Advanced search o scorrendo l'elenco degli schemi esistenti nel menu a discesa. Dopo aver selezionato uno schema, fornisci un nome e una descrizione per il flusso di dati.
Abilita Profile e diagnostica errori
Quindi, seleziona l'interruttore Profile dataset per abilitare il set di dati per Profile. Questo consente di creare una vista olistica degli attributi e dei comportamenti di un’entità. I dati di tutti i set di dati abilitati per Profile verranno inclusi in Profile e le modifiche verranno applicate al momento del salvataggio del flusso di dati.
Error diagnostics consente la generazione di messaggi di errore dettagliati per tutti i record errati che si verificano nel flusso di dati, mentre Partial ingestion consente di acquisire dati contenenti errori, fino a una determinata soglia definita manualmente. Per ulteriori informazioni, consulta la panoramica sull'acquisizione batch parziale.
Abilita avvisi
Puoi abilitare gli avvisi per ricevere notifiche sullo stato del flusso di dati. Seleziona un avviso dall’elenco per abbonarti e ricevere notifiche sullo stato del flusso di dati. Per ulteriori informazioni sugli avvisi, consulta la guida su abbonamento agli avvisi di origini tramite l'interfaccia utente.
Dopo aver fornito i dettagli al flusso di dati, selezionare Next.
Mappare i campi dati su uno schema XDM
Viene visualizzato il passaggio Mapping, che fornisce un'interfaccia per mappare i campi sorgente dallo schema sorgente ai campi XDM di destinazione appropriati nello schema di destinazione.
Experience Platform fornisce consigli intelligenti per campi mappati automaticamente in base allo schema o al set di dati di destinazione selezionato. Puoi regolare manualmente le regole di mappatura in base ai tuoi casi d’uso. In base alle tue esigenze, puoi scegliere di mappare i campi direttamente o utilizzare le funzioni di preparazione dati per trasformare i dati sorgente in modo da derivare valori calcolati o calcolati. Per i passaggi completi sull'utilizzo dell'interfaccia mapper e dei campi calcolati, consulta la guida dell'interfaccia utente della preparazione dati.
Le colonne di controllo come _change_request_type, utilizzate per l'acquisizione dei dati di modifica, vengono lette durante l'acquisizione ma non sono memorizzate nello schema di destinazione.
Gli schemi relazionali supportano anche le relazioni tra set di dati utilizzando mappature di chiave primaria ed esterna.
Per ulteriori informazioni, consulta la panoramica di Data Mirror e la documentazione tecnica sugli schemi relazionali.
Una volta mappati correttamente i dati di origine, selezionare Next.
Pianificazione esecuzioni dell’acquisizione
Viene visualizzato il passaggio Scheduling, che consente di configurare una pianificazione di acquisizione per acquisire automaticamente i dati di origine selezionati utilizzando le mappature configurate. Per impostazione predefinita, la pianificazione è impostata su Once. Per regolare la frequenza di acquisizione, selezionare Frequency, quindi selezionare un'opzione dal menu a discesa.
Se imposti la frequenza di acquisizione su Minute, Hour, Day o Week, devi impostare un intervallo per stabilire un intervallo di tempo impostato tra ogni acquisizione. Ad esempio, se la frequenza di acquisizione è impostata su Day e l'intervallo è impostato su 15, il flusso di dati verrà pianificato in modo da acquisire i dati ogni 15 giorni.
Durante questo passaggio, puoi anche abilitare backfill e definire una colonna per l'acquisizione incrementale dei dati. La retrocompilazione viene utilizzata per acquisire i dati storici, mentre la colonna definita per l’acquisizione incrementale consente di distinguere i nuovi dati dai dati esistenti.
Per ulteriori informazioni sulle configurazioni di pianificazione, consulta la tabella seguente.
Configura la frequenza per indicare la frequenza con cui deve essere eseguito il flusso di dati. Puoi impostare la frequenza su:
- Una volta: imposta la frequenza su
onceper creare un'acquisizione unica. Le configurazioni di intervallo e backfill non sono disponibili quando crei un flusso di dati di acquisizione una tantum. Per impostazione predefinita, la frequenza di pianificazione è impostata su una volta. - Minuti: imposta la frequenza su
minuteper pianificare il flusso di dati in modo da acquisire i dati al minuto. - Ora: imposta la frequenza su
hourper pianificare il flusso di dati per acquisire i dati su base oraria. - Giorno: imposta la frequenza su
dayper pianificare il flusso di dati in modo da acquisire i dati su base giornaliera. - Settimana: imposta la frequenza su
weekper pianificare il flusso di dati in modo da acquisire i dati su base settimanale. Per ulteriori informazioni, consulta la sezione su [informazioni sulla pianificazione dell’acquisizione settimanale] (#weekly).
Dopo aver selezionato una frequenza, puoi configurare l’impostazione dell’intervallo per stabilire l’intervallo di tempo tra ogni acquisizione. Ad esempio, se imposti la frequenza su giorno e configuri l’intervallo su 15, il flusso di dati verrà eseguito ogni 15 giorni. Impossibile impostare l'intervallo su zero. Il valore dell'intervallo minimo accettato per ciascuna frequenza è il seguente:
- Una volta: n/d
- Minuto: 15
- Ora: 1
- Giorno: 1
- Settimana: 1
Informazioni sulla pianificazione dell’acquisizione settimanale weekly
Quando scegli di impostare il flusso di dati in modo che venga eseguito secondo una pianificazione settimanale, il flusso di dati viene eseguito in base a uno dei seguenti scenari:
- Se l’origine dati è stata creata ma non sono ancora stati acquisiti dati, il primo flusso di dati settimanale verrà eseguito 7 giorni dopo la data di creazione dell’origine. Questo intervallo di 7 giorni inizia sempre da quando è stata creata l’origine, indipendentemente da quando hai impostato la pianificazione. Dopo l’esecuzione iniziale, il flusso di dati continuerà a essere eseguito settimanalmente in base alla pianificazione configurata.
- Se i dati dell’origine sono stati precedentemente acquisiti e li pianifichi di nuovo per l’acquisizione settimanale, il flusso di dati successivo verrà eseguito 7 giorni dopo l’acquisizione riuscita più recente.
Verifica il flusso di dati
Viene visualizzato il passaggio Review, che consente di rivedere il nuovo flusso di dati prima che venga creato. I dettagli sono raggruppati nelle seguenti categorie:
- Connection: mostra il tipo di origine, il percorso pertinente del file di origine scelto e la quantità di colonne all'interno di tale file di origine.
- Assign dataset & map fields: visualizza il set di dati in cui verranno acquisiti i dati di origine, insieme allo schema associato. Se utilizzi uno schema relazionale, verifica che i campi obbligatori, come la chiave primaria e l’identificatore di versione, siano mappati correttamente. Inoltre, assicurati che tutte le colonne di controllo dell’acquisizione dati di modifica siano configurate correttamente. I set di dati che utilizzano schemi relazionali supportano più modelli di dati e abilitano flussi di lavoro di acquisizione dati di modifica.
- Scheduling: mostra il periodo attivo, la frequenza e l'intervallo della pianificazione di acquisizione.
Dopo aver rivisto il flusso di dati, seleziona Finish e lascia un po' di tempo per la creazione del flusso di dati.
Monitorare il flusso di dati
Una volta creato il flusso di dati, puoi monitorare i dati che vengono acquisiti tramite di esso per visualizzare informazioni su tassi di acquisizione, successo ed errori. Per ulteriori informazioni su come monitorare il flusso di dati, consulta l'esercitazione su account di monitoraggio e flussi di dati nell'interfaccia utente.
Eliminare il flusso di dati
È possibile eliminare i flussi di dati non più necessari o creati in modo errato utilizzando la funzione Delete disponibile nell'area di lavoro Dataflows. Per ulteriori informazioni su come eliminare i flussi di dati, vedere l'esercitazione sull'eliminazione di flussi di dati nell'interfaccia utente.
Passaggi successivi
Seguendo questa esercitazione, è stato creato un flusso di dati per portare dati dall’origine del database ad Experience Platform. I dati in arrivo possono ora essere utilizzati da servizi Experience Platform downstream come Real-Time Customer Profile e Data Science Workspace. Per ulteriori informazioni, consulta i seguenti documenti: