Un flusso di dati è un'attività pianificata che recupera e trasferisce dati da un'origine a un set di dati della piattaforma. Questa esercitazione fornisce i passaggi per configurare un nuovo flusso di dati utilizzando l'account del database.
Questa esercitazione richiede una buona conoscenza dei seguenti componenti di Adobe Experience Platform:
Inoltre, questa esercitazione richiede che sia già stato creato un account di database. Un elenco di esercitazioni per la creazione di diversi connettori di database nell'interfaccia utente è disponibile nella panoramica dei connettori di origine.
Dopo aver creato l'account del database, viene visualizzato il passaggio Select data, che fornisce un'interfaccia interattiva per esplorare la gerarchia del database.
È possibile utilizzare l'opzione Search nella parte superiore della pagina per identificare rapidamente i dati di origine che si intende utilizzare.
L'opzione per i dati dell'origine di ricerca è disponibile per tutti i connettori sorgente basati su tabelle, ad eccezione dei connettori Analytics, Classifications, Event Hubs e Kinesis.
Una volta trovati i dati di origine, selezionate la directory, quindi fate clic su Next.
Viene visualizzato il passaggio Mapping, che fornisce un'interfaccia interattiva per mappare i dati di origine a un set di dati della piattaforma.
Scegliere un set di dati in entrata in cui assimilare i dati. È possibile utilizzare un set di dati esistente o crearne uno nuovo.
Per assimilare i dati in un dataset esistente, selezionare Existing dataset, quindi fare clic sull'icona del dataset.
Viene visualizzata la finestra di dialogo Select dataset. Trovare il set di dati che si desidera utilizzare, selezionarlo, quindi fare clic su Continue.
Per inserire i dati in un nuovo dataset, selezionare New dataset e immettere un nome e una descrizione per il dataset nei campi forniti.
È possibile allegare un campo dello schema immettendo un nome dello schema nella barra di ricerca Select schema. Potete anche selezionare l'icona a discesa per visualizzare un elenco degli schemi esistenti. In alternativa, potete selezionare Advanced search per accedere alla schermata degli schemi esistenti, inclusi i rispettivi dettagli.
Durante questo passaggio, potete abilitare il dataset per Real-time Customer Profile e creare una visualizzazione olistica degli attributi e dei comportamenti di un'entità. I dati di tutti i set di dati abilitati saranno inclusi in Profile e le modifiche verranno applicate al salvataggio del flusso di dati.
Attivate il pulsante Profile dataset per abilitare il set di dati di destinazione per Profile.
Viene visualizzata la finestra di dialogo Select schema. Selezionare lo schema che si desidera applicare al nuovo dataset, quindi fare clic su Done.
In base alle esigenze, è possibile scegliere di mappare direttamente i campi oppure utilizzare le funzioni di mappatura per trasformare i dati di origine in modo da derivare i valori calcolati o calcolati. Per ulteriori informazioni sulla mappatura dei dati e sulle funzioni di mappatura, fare riferimento all'esercitazione sulla mappatura dei dati CSV ai campi dello schema XDM.
Platform fornisce raccomandazioni intelligenti per i campi mappati automaticamente in base allo schema di destinazione o al dataset selezionato. Puoi regolare manualmente le regole di mappatura in base ai tuoi casi di utilizzo.
Selezionare Preview data per visualizzare i risultati della mappatura fino a 100 righe di dati di esempio dal set di dati selezionato.
Durante l'anteprima, la colonna dell'identità ha priorità come primo campo, in quanto rappresenta le informazioni chiave necessarie per convalidare i risultati della mappatura.
Una volta mappati i dati di origine, selezionare Close.
Viene visualizzato il passaggio Scheduling, che consente di configurare una pianificazione di assimilazione per l'acquisizione automatica dei dati di origine selezionati tramite le mappature configurate. Nella tabella seguente sono riportati i diversi campi configurabili per la pianificazione:
Campo | Descrizione |
---|---|
Frequenza | Le frequenze selezionabili sono Once , Minute , Hour , Day e Week . |
Intervallo | Un numero intero che imposta l'intervallo per la frequenza selezionata. |
Ora di inizio | Una marca temporale UTC che indica quando è impostata la prima assimilazione. |
Backfill | Un valore booleano che determina i dati inizialmente acquisiti. Se Backfill è abilitato, tutti i file correnti nel percorso specificato verranno acquisiti durante la prima assimilazione pianificata. Se Backfill è disattivato, verranno acquisiti solo i file caricati tra la prima esecuzione dell'assimilazione e l'ora di inizio. I file caricati prima dell'ora di inizio non vengono assimilati. |
Colonna Delta | Opzione con un set filtrato di campi dello schema di origine di tipo, data o ora. Questo campo è utilizzato per distinguere tra dati nuovi ed esistenti. I dati incrementali verranno acquisiti in base alla marca temporale della colonna selezionata. |
I flussi di dati sono progettati per l'acquisizione automatica dei dati su base programmata. Per iniziare, selezionate la frequenza di assimilazione. Quindi, impostare l'intervallo per specificare il periodo tra due esecuzioni di flusso. Il valore dell'intervallo deve essere un numero intero diverso da zero e deve essere impostato su maggiore o uguale a 15.
Per impostare l’ora di inizio dell’assimilazione, regolate la data e l’ora visualizzate nella casella Ora di inizio. In alternativa, potete selezionare l'icona del calendario per modificare il valore dell'ora di inizio. L'ora di inizio deve essere maggiore o uguale all'ora UTC corrente.
Selezionare Load incremental data by per assegnare la colonna delta. Questo campo consente di distinguere tra dati nuovi ed esistenti.
Per impostare l'inserimento una tantum, selezionate la freccia a discesa di frequenza e selezionate Once.
Interval e non Backfill sono visibili durante un'assimilazione una tantum.
Dopo aver fornito i valori appropriati alla pianificazione, selezionare Next.
Viene visualizzato il passaggio Dataflow detail, che consente di assegnare un nome e una breve descrizione al nuovo flusso di dati.
Durante questo processo, è inoltre possibile abilitare Partial ingestion e Error diagnostics. L'abilitazione di Partial ingestion consente di assimilare i dati contenenti errori fino a una determinata soglia. Una volta che Partial ingestion è abilitato, trascinare il quadrante Error threshold % per regolare la soglia di errore del batch. In alternativa, è possibile regolare manualmente la soglia selezionando la casella di input. Per ulteriori informazioni, vedere la panoramica sull'assimilazione parziale dei batch.
Immettete i valori per il flusso di dati e selezionate Next.
Viene visualizzato il passaggio Review, che consente di rivedere il nuovo flusso di dati prima che venga creato. I dettagli sono raggruppati nelle seguenti categorie:
Dopo aver rivisto il flusso di dati, fate clic su Finish e lasciate che sia possibile creare il flusso di dati.
Una volta creato il flusso di dati, puoi monitorare i dati che vengono acquisiti attraverso di esso per visualizzare informazioni su velocità di assimilazione, successo ed errori. Per ulteriori informazioni su come monitorare il flusso di dati, consulta l'esercitazione su monitorare gli account e i flussi di dati nell'interfaccia utente.
È possibile eliminare i flussi di dati che non sono più necessari o che sono stati creati in modo non corretto utilizzando la funzione Delete disponibile nell'area di lavoro Dataflows. Per ulteriori informazioni sull'eliminazione dei flussi di dati, vedere l'esercitazione sull'eliminazione dei flussi di dati nell'interfaccia utente](…/delete.md).[
Seguendo questa esercitazione, è stato creato un flusso di dati per inserire i dati da un database esterno e ottenere informazioni dettagliate sul monitoraggio dei set di dati. I dati in entrata possono ora essere utilizzati dai servizi a valle Platform quali Real-time Customer Profile e Data Science Workspace. Per ulteriori informazioni, consulta i documenti seguenti:
Le sezioni seguenti forniscono informazioni aggiuntive sull'utilizzo dei connettori di origine.
Quando un flusso di dati viene creato, diventa immediatamente attivo e i dati vengono acquisiti in base alla pianificazione specificata. Puoi disattivare un flusso di dati attivo in qualsiasi momento seguendo le istruzioni riportate di seguito.
Nell'area di lavoro Sources, selezionare la scheda Dataflows. Quindi, selezionate il flusso di dati da disattivare.
La colonna Properties viene visualizzata sul lato destro dello schermo, incluso un pulsante di attivazione/disattivazione Enabled. Selezionate l’opzione per disattivare il flusso di dati. La stessa opzione può essere utilizzata per riattivare un flusso di dati dopo che è stato disabilitato.
I dati in entrata provenienti dal connettore di origine possono essere utilizzati per arricchire e compilare i dati Real-time Customer Profile. Per ulteriori informazioni sulla compilazione dei dati Real-time Customer Profile, vedere l'esercitazione sulla popolazione di profili.