Monitorare l’acquisizione del data lake

IMPORTANT
Le origini di streaming, ad esempio l'origine API HTTP, non sono attualmente supportate dal dashboard di monitoraggio. Al momento, è possibile utilizzare il dashboard solo per monitorare le origini batch.

Puoi utilizzare il dashboard di monitoraggio nell’interfaccia utente di Adobe Experience Platform per recuperare metriche relative ai processi di acquisizione e conservazione dei dati nel data lake. Utilizza i grafici nell’interfaccia per monitorare le tendenze di acquisizione e conservazione nel tempo e riepilogare le prestazioni in tutti i flussi di dati di origine.

Leggi questo documento per scoprire come utilizzare il dashboard di monitoraggio per monitorare tutte le elaborazioni di dati nel data lake, inclusi sia l’acquisizione che la conservazione.

Introduzione get-started

Questo tutorial richiede una buona conoscenza dei seguenti componenti di Adobe Experience Platform:

  • Flussi dati: i flussi dati sono una rappresentazione dei processi di dati che spostano i dati in Experience Platform. I flussi di dati sono configurati tra servizi diversi, consentendo di spostare i dati dai connettori di origine ai set di dati di destinazione, a Identity e Profile e a Destinations.
    • Esecuzioni flusso di dati: le esecuzioni del flusso di dati sono i processi pianificati ricorrenti in base alla configurazione della frequenza dei flussi di dati selezionati.
  • Origini: Experience Platform consente di acquisire dati da varie origini e allo stesso tempo di strutturare, etichettare e migliorare i dati in arrivo tramite i servizi Experience Platform.
  • Identity Service: ottieni una migliore visione dei singoli clienti e del loro comportamento collegando le identità tra dispositivi e sistemi.
  • Profilo cliente in tempo reale: fornisce un profilo consumatore unificato in tempo reale basato su dati aggregati provenienti da più origini.
  • Sandbox: Experience Platform fornisce sandbox virtuali che suddividono una singola istanza Experience Platform in ambienti virtuali separati, utili per le attività di sviluppo e aggiornamento delle applicazioni di esperienza digitale.

Utilizzare la dashboard di monitoraggio per l’acquisizione del data lake

Seleziona Data lake dall'intestazione principale nel dashboard di monitoraggio per visualizzare il tasso di acquisizione del data lake.

Dashboard di monitoraggio con la scheda delle origini selezionata.

Il grafico Tasso di acquisizione visualizza il tasso di acquisizione dei dati in base all'intervallo di tempo configurato. Per impostazione predefinita, nel dashboard di monitoraggio vengono visualizzate le percentuali di acquisizione delle ultime 24 ore. Per i passaggi su come configurare l'intervallo di tempo, leggere la guida alla configurazione dell'intervallo di tempo di monitoraggio.

Per impostazione predefinita, il grafico è abilitato alla visualizzazione. Per nascondere il grafico, selezionare Metriche e grafici per disabilitare l'attivazione e nascondere il grafico.

Grafico delle metriche del tasso di acquisizione.

Nella parte inferiore del dashboard viene visualizzata una tabella che illustra il rapporto delle metriche correnti per tutti i flussi di dati di origine esistenti.

Tabella delle metriche del dashboard di monitoraggio.

Metriche
Descrizione
Record ricevuti
Numero totale di record ricevuti da una determinata origine.
Record acquisiti
Numero totale di record acquisiti nel data lake.
Record eliminati
Numero totale di record eliminati a causa delle impostazioni di conservazione del data lake o delle modifiche apportate alle operazioni di acquisizione dei dati.
Record ignorati
Numero totale di record ignorati. Un record ignorato si riferisce a campi che sono stati ignorati perché non erano necessari per l’acquisizione. Ad esempio, se crei un flusso di dati di origini con acquisizione parziale abilitata, puoi configurare una soglia di tasso di errore accettabile. Durante il processo di acquisizione, i record dei campi non obbligatori, come i campi di identità, vengono ignorati se rientrano nella soglia di errore.
Record con errori
Numero totale di record che non è stato possibile acquisire a causa di errori.
Tasso acquisiti
La percentuale di record acquisiti in base al numero totale di record ricevuti.
Totale flussi dati totali non riusciti
Numero totale di flussi di dati non riusciti.

Puoi filtrare ulteriormente i dati utilizzando le opzioni fornite sopra la tabella delle metriche:

Opzioni di filtro
Descrizione
Cerca
Utilizzare la barra di ricerca per filtrare la visualizzazione in base a un singolo tipo di origine.
Origini
Seleziona Origini per filtrare la visualizzazione e visualizzare i dati delle metriche in base al tipo di origine. Questa è la visualizzazione predefinita utilizzata dal dashboard di monitoraggio.
Flussi di dati
Seleziona Flussi dati per filtrare la visualizzazione e visualizzare i dati delle metriche per flusso di dati.
Mostra solo errori
Seleziona Mostra solo errori per filtrare la visualizzazione e visualizzare solo i flussi di dati che hanno segnalato errori di acquisizione.
Le mie fonti
Puoi filtrare ulteriormente la vista utilizzando il menu a discesa Risorse personali. Utilizza il menu a discesa per filtrare la vista per categoria. In alternativa, è possibile selezionare Tutte le origini per visualizzare le metriche su tutte le origini o, oppure selezionare Le mie origini per visualizzare solo le origini con cui si dispone di un account corrispondente.

Per personalizzare la visualizzazione delle colonne, selezionare l'icona delle impostazioni delle colonne icona-colonna .

Dashboard di monitoraggio con licona delle impostazioni delle colonne selezionata.

Utilizzare quindi la finestra Personalizza tabella per selezionare le colonne che si desidera visualizzare nel dashboard. Al termine, selezionare Applica.

Finestra popup di personalizzazione colonna nel dashboard di monitoraggio.

Per monitorare i dati che vengono acquisiti in un flusso di dati specifico, seleziona l'icona del filtro filter accanto a un'origine.

TIP
È possibile utilizzare il dashboard di monitoraggio per monitorare le metriche di eliminazione dei dati per i record eliminati utilizzando i criteri di conservazione dei dati. Per ulteriori informazioni sulla conservazione dei dati, leggere la guida sull'impostazione dei criteri di conservazione dei dati.

Monitorare un flusso di dati specifico selezionando licona del filtro accanto a una determinata origine.

La tabella delle metriche viene aggiornata con una tabella di flussi di dati attivi che corrispondono all’origine selezionata. Durante questo passaggio, puoi visualizzare ulteriori informazioni sui flussi di dati, tra cui il set di dati e il tipo di dati corrispondenti, nonché una marca temporale per indicare quando sono stati attivi per l’ultima volta.

Per esaminare ulteriormente un flusso di dati, seleziona l'icona filtro filter accanto a un flusso di dati.

Tabella dei flussi di dati nel dashboard di monitoraggio.

Viene quindi visualizzata un’interfaccia che elenca tutte le iterazioni di esecuzione del flusso di dati selezionato.

Le esecuzioni del flusso di dati rappresentano un’istanza dell’esecuzione del flusso di dati. Ad esempio, se un flusso di dati è pianificato per essere eseguito ogni ora alle 09:00, alle 00:00 e alle 00:00, sono disponibili tre istanze di un flusso. Le esecuzioni del flusso sono specifiche per la tua particolare organizzazione.

Per verificare le metriche di una specifica iterazione di esecuzione del flusso di dati, seleziona l'icona del filtro filter accanto al flusso di dati.

Pagina delle metriche di esecuzione del flusso di dati.

Utilizza la pagina dei dettagli dell’esecuzione del flusso di dati per visualizzare le metriche e le informazioni dell’iterazione di esecuzione selezionata.

Pagina dei dettagli di esecuzione del flusso di dati.

Dettagli dell’esecuzione del flusso di dati
Descrizione
Record acquisiti
Numero totale di record acquisiti dall’esecuzione del flusso di dati.
Record con errori
Numero totale di record che non sono stati acquisiti a causa di errori nell’esecuzione del flusso di dati.
File totali
Numero totale di file nell’esecuzione del flusso di dati.
Dimensione dei dati
Dimensione totale dei dati contenuti nell’esecuzione del flusso di dati.
ID esecuzione flusso di dati
ID dell’iterazione di esecuzione del flusso di dati.
ID organizzazione
ID dell’organizzazione in cui è stata creata l’esecuzione del flusso di dati.
Stato
Stato dell’esecuzione del flusso di dati.
Avvio dell’esecuzione flusso di dati
Un timestamp che indica quando è iniziata l’esecuzione del flusso di dati.
Fine esecuzione flusso di dati
Un timestamp che indica quando è terminata l’esecuzione del flusso di dati.
Set di dati
Set di dati utilizzato per creare il flusso di dati.
Tipo di dati
Il tipo di dati che era nel flusso di dati.
Acquisizione parziale
L’acquisizione in batch parziale consente di acquisire dati contenenti errori, fino a una determinata soglia configurabile. Questa funzione consente di acquisire correttamente in Experience Platform tutti i dati accurati, mentre tutti i dati errati vengono raggruppati separatamente con informazioni sul motivo della validità. Puoi abilitare l’acquisizione parziale durante il processo di creazione del flusso di dati.
Diagnostica degli errori
La diagnostica degli errori indica all’origine di produrre diagnostica degli errori a cui puoi fare riferimento in seguito durante il monitoraggio dell’attività del set di dati e dello stato del flusso di dati. Puoi abilitare la diagnostica degli errori durante il processo di creazione del flusso di dati.
Riepilogo errori
Dato un flusso di dati non riuscito, nel riepilogo degli errori vengono visualizzati un codice e una descrizione di errore che riepilogano il motivo per cui l’iterazione dell’esecuzione non è riuscita.

Se il flusso di dati segnala errori, puoi scorrere verso il basso fino alla parte inferiore della pagina e utilizzare l'interfaccia Errori di esecuzione flusso di dati.

Utilizzare la sezione Record non riusciti per visualizzare le metriche nei record non acquisiti a causa di errori. Per visualizzare un report completo degli errori, selezionare Anteprima diagnostica errori. Per scaricare una copia della diagnostica degli errori e del manifesto del file, selezionare Scarica, quindi copiare la chiamata API di esempio da utilizzare con l'API Data Access.

NOTE
È possibile utilizzare la diagnostica degli errori solo se la funzione è stata abilitata durante il processo di creazione della connessione di origine.

Passaggi successivi next-steps

Seguendo questa esercitazione, hai imparato a monitorare il tasso di acquisizione del data lake utilizzando il dashboard Monitoraggio. Hai anche imparato a identificare gli errori che causano errori del flusso di dati durante l’acquisizione. Per ulteriori informazioni, consulta i seguenti documenti:

recommendation-more-help
d4f38c9a-ed8e-4b74-98e7-57b4df1b999f