Surveillance des flux de données pour les sources de diffusion en continu dans l’interface utilisateur

Ce tutoriel décrit les étapes de surveillance des flux de données pour les sources en flux continu à l’aide de l’espace de travail Sources.

Prise en main

Ce tutoriel nécessite une compréhension du fonctionnement des composants suivants d’Adobe Experience Platform :

  • Flux de données : les flux de données sont une représentation des tâches de données qui déplacent ces dernières dans Experience Platform. Les flux de données sont configurés sur différents services, ce qui permet de déplacer les données des connecteurs sources vers des jeux de données cibles, vers Identity et Profile, et vers Destinations.
    • Exécutions de flux de données : les exécutions de flux de données sont les tâches planifiées récurrentes en fonction de la configuration de la fréquence des flux de données sélectionnés.
  • Sources : Experience Platform permet d’ingérer des données provenant de diverses sources tout en vous offrant la possibilité de structurer, d’étiqueter et d’améliorer les données entrantes à l’aide des services d’Experience Platform.
  • Sandbox : Experience Platform fournit des sandbox virtuels qui divisent une instance Experience Platform unique en environnements virtuels distincts pour favoriser le développement et l’évolution d’applications d’expérience digitale.

Surveillance des flux de données pour les sources de diffusion en continu

Dans l’interface utilisateur d’Experience Platform, sélectionnez Sources dans la barre de navigation de gauche pour accéder à l’espace de travail Sources. L’écran Catalogue affiche diverses sources pour lesquelles vous pouvez créer un compte.

Pour afficher les flux de données existants pour les sources en flux continu, sélectionnez Flux de données dans l’en-tête supérieur.

catalogue

La page Flux de données contient une liste de tous les flux de données existants de votre organisation, y compris des informations sur leurs données sources, le nom du compte et le statut d’exécution du flux de données.

Sélectionnez le nom du flux de données à afficher.

flux de données

Le tableau suivant contient des informations supplémentaires sur les statuts d’exécution des flux de données :

État
Description
Terminé
Le statut Completed indique que tous les enregistrements de l’exécution de flux de données correspondante ont été traités au cours de la période d’une heure. Un statut de Completed peut toujours contenir des erreurs dans les exécutions de flux de données.
Réussite
Le statut Success indique que tous les enregistrements pour l’exécution de flux de données correspondante ont été traités au cours de la période d’une heure et qu’aucune erreur n’a été rencontrée au cours de l’exécution du flux de données.
En cours de traitement
Le statut Processing indique qu’un flux de données n’est pas encore actif. Ce statut se rencontre souvent immédiatement après la création d’un nouveau flux de données.
Erreur
Le statut Error indique que le processus d’activation d’un flux de données a été interrompu.
Aucune exécution
Le statut No runs indique que le flux de données a été créé, mais qu’aucune exécution de flux de données n’a été démarrée.

La page Activité du flux de données affiche des informations spécifiques sur votre flux de données en flux continu. La bannière supérieure contient le nombre cumulé d’enregistrements ingérés et d’enregistrements ayant échoué pour toutes les exécutions de flux de données de diffusion en continu dans la période sélectionnée.

dataflow-activity

Par défaut, les données affichées contiennent les taux d’ingestion des sept derniers jours. Sélectionnez 7 derniers jours pour ajuster la période des enregistrements affichés.

Une fenêtre pop-up de calendrier s’affiche, vous offrant des options pour d’autres périodes d’ingestion. Vous pouvez configurer la période d’exécution du flux de données pour afficher les exécutions de flux des sept jours précédents ou des 30 derniers jours. Vous pouvez également configurer le calendrier interactif pour définir une période personnalisée de votre choix. Lorsque vous avez terminé, sélectionnez Appliquer.

calendar

La moitié inférieure de la page affiche des informations sur le nombre d’enregistrements reçus, ingérés et ayant échoué, par exécution de flux. Chaque exécution de flux est enregistrée dans une fenêtre horaire.

dataflow-run

Mesures d’exécution de flux de données dataflow-run-metrics

Chaque exécution de flux de données affiche les détails suivants :

  • Début d’exécution du flux de données : heure à laquelle l’exécution du flux de données a démarré.
  • Temps de traitement : temps nécessaire au traitement du flux de données.
  • Enregistrements reçus : nombre total d’enregistrements reçus dans le flux de données d’un connecteur source.
  • Enregistrements ingérés : nombre total d’enregistrements ingérés dans Data Lake.
  • Enregistrements avec avertissements : nombre total d’enregistrements avec avertissements qui ont été ingérés. Toutes les erreurs de transformation du mappeur sont signalées comme avertissements et les lignes partiellement ingérées sont étiquetées comme success avec un avertissement. Remarque : la prise en charge de l’ingestion d’enregistrements avec des avertissements n’est disponible que pour les sources en flux continu.
  • Enregistrements en échec : nombre d’enregistrements qui n’ont pas été ingérés dans Data Lake en raison d’erreurs dans les données.
  • Taux d’ingestion : taux de succès des enregistrements ingérés dans Data Lake. Cette mesure s’applique lorsque l’option ​ Ingestion partielle ​ est activée.
  • Statut : représente le statut du flux de données : Terminé ou Traitement. Terminé signifie que tous les enregistrements pour l’exécution du flux de données correspondant ont été traités dans la période d’une heure. Traitement signifie que l’exécution du flux de données n’est pas encore terminée.

La page Présentation de l’exécution du flux de données contient des informations supplémentaires sur votre flux de données, telles que l’identifiant d’exécution du flux de données correspondant, le jeu de données cible et l’identifiant d’organisation.

Une exécution de flux avec des erreurs contient également le panneau Erreurs d’exécution du flux de données qui affiche l’erreur particulière qui a conduit à l’échec de l’exécution, ainsi que le nombre total d’enregistrements qui ont échoué.

dataflow-run-overview

Afficher les enregistrements avec des avertissements warnings

Enregistrements avec avertissements affiche une liste des avertissements de transformation du mappeur qui se sont produits lors de l’exécution de votre flux. Les lignes partiellement ingérées sont considérées comme réussies et sont accompagnées d’avertissements si des erreurs de transformation du mappeur sont détectées.

Par défaut, toutes les erreurs de transformation du mappeur sont considérées comme des avertissements, sauf si elles sont l’une des suivantes :

  • Erreurs de syntaxe
  • Références à des attributs qui n’existent pas
  • Incompatibilité des types de données XDM

Pour afficher les diagnostics d’erreur, sélectionnez Aperçu des diagnostics d’erreur.

enregistrements avec avertissements

La fenêtre Aperçu des diagnostics d’erreur vous permet de prévisualiser jusqu’à 100 erreurs et/ou avertissements concernant l’exécution de votre flux de données. À partir de là, vous pouvez également télécharger le manifeste d’échec d’ingestion pour plus d’informations, à l’aide de l’API Data Access.

diagnostics

Étapes suivantes

En suivant ce tutoriel, vous avez utilisé avec succès l’espace de travail Sources pour surveiller vos flux de données de diffusion en continu et identifier les erreurs qui ont conduit à l’échec des flux de données. Pour plus d’informations, consultez les documents suivants :

recommendation-more-help
337b99bb-92fb-42ae-b6b7-c7042161d089