Monitorare i flussi di dati per le origini di streaming nell’interfaccia utente
Questa esercitazione descrive i passaggi per il monitoraggio dei flussi di dati per le origini di streaming che utilizzano l'area di lavoro Sources.
Introduzione
Questo tutorial richiede una buona conoscenza dei seguenti componenti di Adobe Experience Platform:
- Flussi dati: i flussi dati sono una rappresentazione dei processi di dati che spostano i dati in Experience Platform. I flussi di dati sono configurati tra servizi diversi, consentendo di spostare i dati dai connettori di origine ai set di dati di destinazione, a Identity e Profile e a Destinations.
- Esecuzioni flusso di dati: le esecuzioni del flusso di dati sono i processi pianificati ricorrenti in base alla configurazione della frequenza dei flussi di dati selezionati.
- Origini: Experience Platform consente di acquisire dati da varie origini e allo stesso tempo di strutturare, etichettare e migliorare i dati in arrivo tramite i servizi Experience Platform.
- Sandbox: Experience Platform fornisce sandbox virtuali che suddividono una singola istanza Experience Platform in ambienti virtuali separati, utili per le attività di sviluppo e aggiornamento delle applicazioni di esperienza digitale.
Monitorare i flussi di dati per le origini di streaming
Nell'interfaccia utente di Experience Platform, selezionare Sources dalla barra di navigazione a sinistra per accedere all'area di lavoro Sources. Nella schermata Catalog sono visualizzate diverse origini per le quali è possibile creare un account con.
Per visualizzare i flussi di dati esistenti per le origini di streaming, seleziona Dataflows dall'intestazione superiore.
La pagina Dataflows contiene un elenco di tutti i flussi di dati esistenti nell'organizzazione, incluse informazioni sui dati di origine, il nome account e lo stato di esecuzione del flusso di dati.
Seleziona il nome del flusso di dati che desideri visualizzare.
La tabella seguente contiene ulteriori informazioni sugli stati di esecuzione del flusso di dati:
Completed indica che tutti i record per l’esecuzione del flusso di dati corrispondente sono stati elaborati entro il periodo di un’ora. Uno stato Completed può comunque contenere errori nelle esecuzioni del flusso di dati.Success indica che tutti i record per l’esecuzione del flusso di dati corrispondente sono stati elaborati entro il periodo di un’ora e che non sono stati rilevati errori durante l’esecuzione del flusso di dati.Processing indica che un flusso di dati non è ancora attivo. Questo stato si verifica spesso subito dopo la creazione di un nuovo flusso di dati.Error indica che il processo di attivazione di un flusso di dati è stato interrotto.No runs indica che il flusso di dati è stato creato ma non è stata avviata alcuna esecuzione del flusso di dati.Nella pagina Dataflow Activity vengono visualizzate informazioni specifiche sul flusso di dati in streaming. Il banner superiore contiene il numero cumulativo di record acquisiti e di record non riusciti per tutti i flussi di dati in streaming eseguiti nell’intervallo di date selezionato.
Per impostazione predefinita, i dati visualizzati contengono i tassi di acquisizione degli ultimi sette giorni. Selezionare Last 7 days per regolare l'intervallo di tempo dei record visualizzati.
Viene visualizzata una finestra a comparsa del calendario che fornisce opzioni per intervalli di tempo di acquisizione alternativi. Puoi configurare l’intervallo di tempo di esecuzione del flusso di dati per visualizzare le esecuzioni del flusso dei sette giorni precedenti o degli ultimi 30 giorni. In alternativa, puoi configurare il calendario interattivo per impostare un intervallo di tempo personalizzato. Al termine, selezionare Apply.
Nella metà inferiore della pagina vengono visualizzate informazioni sul numero di record ricevuti, acquisiti e non riusciti per esecuzione del flusso. Ogni esecuzione di flusso viene registrata in una finestra oraria.
Metriche di esecuzione del flusso di dati dataflow-run-metrics
Ogni singola esecuzione del flusso di dati mostra i seguenti dettagli:
- Dataflow run start: ora di inizio dell'esecuzione del flusso di dati.
- Processing time: tempo necessario per l'elaborazione del flusso di dati.
- Records Received: numero totale di record ricevuti nel flusso di dati da un connettore di origine.
- Records Ingested: numero totale di record acquisiti in Data Lake.
- Records with Warnings: numero totale di record con avvisi acquisiti. Tutti gli errori di trasformazione dei mapper vengono segnalati come avvisi e le righe parzialmente acquisite vengono etichettate come
successcon un avviso. Nota: il supporto per l'acquisizione di record con avvisi è disponibile solo per le origini di streaming. - Records Failed: numero di record che non sono stati acquisiti in Data Lake a causa di errori nei dati.
- Ingestion Rate: percentuale di successo dei record acquisiti in Data Lake. Questa metrica è applicabile quando Partial Ingestion è abilitato.
- Status: rappresenta lo stato del flusso di dati: Completed o Processing. Completed significa che tutti i record per l'esecuzione del flusso di dati corrispondente sono stati elaborati entro il periodo di un'ora. Processing significa che l'esecuzione del flusso di dati non è ancora terminata.
La pagina Dataflow run overview contiene informazioni aggiuntive sul flusso di dati, ad esempio l'ID di esecuzione del flusso di dati corrispondente, il set di dati di destinazione e l'ID organizzazione.
Un'esecuzione di flusso con errori contiene anche il pannello Dataflow run errors, che visualizza l'errore specifico che ha portato all'errore dell'esecuzione, nonché il numero totale di record che non sono riusciti.
Visualizza record con avvisi warnings
Records with warnings visualizza un elenco di avvisi di trasformazione del mapper che si sono verificati durante l'esecuzione del flusso. Le righe parzialmente acquisite sono considerate riuscite e vengono aggiunte avvertenze se vengono rilevati errori di trasformazione del mapper.
Per impostazione predefinita, tutti gli errori di trasformazione dei mapper vengono considerati come avvisi, ad eccezione dei seguenti:
- Errori di sintassi
- Riferimenti ad attributi inesistenti
- Mancata corrispondenza tra i tipi di dati XDM
Per visualizzare la diagnostica degli errori, selezionare Preview error diagnostics.
La finestra Error diagnostics preview consente di visualizzare in anteprima fino a 100 errori e/o avvisi relativi all'esecuzione del flusso di dati. Da qui è inoltre possibile scaricare il manifesto dell’errore di acquisizione per ulteriori informazioni, utilizzando l’API Data Access.
Passaggi successivi
Seguendo questa esercitazione, l'area di lavoro Sources è stata utilizzata correttamente per monitorare i flussi di dati in streaming e identificare gli errori che hanno causato eventuali flussi di dati non riusciti. Per ulteriori informazioni, consulta i seguenti documenti: