Surveillance des flux de données pour les sources de flux dans l’interface utilisateur

Ce tutoriel décrit les étapes de surveillance des flux de données pour les sources en continu à l’aide de l’espace de travail Sources .

Prise en main

Ce tutoriel nécessite une compréhension du fonctionnement des composants suivants d’Adobe Experience Platform :

  • Flux de données : les flux de données sont une représentation des tâches de données qui déplacent ces dernières dans Platform. Les flux de données sont configurés sur différents services, ce qui permet de déplacer les données des connecteurs sources vers des jeux de données cibles, vers Identity et Profile, et vers Destinations.
    • Exécutions de flux de données : les exécutions de flux de données sont les tâches planifiées récurrentes en fonction de la configuration de fréquence des flux de données sélectionnés.
  • Sources : Experience Platform permet d’ingérer des données provenant de diverses sources tout en vous offrant la possibilité de structurer, d’étiqueter et d’améliorer les données entrantes à l’aide des services de Platform.
  • Sandbox : Experience Platform fournit des sandbox virtuels qui divisent une instance de plateforme unique en environnements virtuels distincts pour favoriser le développement et l’évolution d’applications d’expérience digitale.

Surveillance des flux de données pour les sources de diffusion en continu

Dans l’interface utilisateur de Platform, sélectionnez Sources à partir de la barre de navigation de gauche pour accéder à l’espace de travail Sources. L’écran Catalogue affiche diverses sources pour lesquelles vous pouvez créer un compte.

Pour afficher les flux de données existants pour les sources de diffusion en continu, sélectionnez Flux de données dans l’en-tête supérieur.

catalogue

La page Flux de données contient une liste de tous les flux de données existants de votre organisation, y compris des informations sur leurs données source, leur nom de compte et leur état d’exécution.

Sélectionnez le nom du flux de données à afficher.

dataflows

Le tableau suivant contient plus d’informations sur les états d’exécution du flux de données :

État
Description
Terminé
L’état Completed indique que tous les enregistrements de l’exécution de flux de données correspondante ont été traités pendant la période d’une heure. Un état Completed peut toujours contenir des erreurs lors des exécutions du flux de données.
Réussite
L’état Success indique que tous les enregistrements de l’exécution de flux de données correspondante ont été traités pendant la période d’une heure et qu’aucune erreur n’a été rencontrée au cours de l’exécution du flux de données.
En cours de traitement
L’état Processing indique qu’un flux de données n’est pas encore actif. Cet état est souvent rencontré immédiatement après la création d’un nouveau flux de données.
Erreur
L’état Error indique que le processus d’activation d’un flux de données a été interrompu.
Aucune exécution
L’état No runs indique que le flux de données a été créé mais qu’aucune exécution de flux de données n’a été lancée.

La page Activité de flux de données affiche des informations spécifiques sur votre flux de données de flux continu. La bannière supérieure contient le nombre cumulé d’enregistrements ingérés et d’enregistrements ayant échoué pour l’ensemble de vos flux de données de diffusion en continu s’exécutant au cours de la période sélectionnée.

dataflow-activity

Par défaut, les données affichées contiennent les taux d’ingestion des sept derniers jours. Sélectionnez 7 derniers jours pour ajuster la période des enregistrements affichés.

Une fenêtre contextuelle de calendrier s’affiche, vous permettant d’accéder à d’autres options de périodes d’ingestion. Vous pouvez configurer la période d’exécution du flux de données pour afficher les exécutions de flux des sept derniers jours ou des 30 derniers jours. Vous pouvez également configurer le calendrier interactif pour définir une période personnalisée de votre choix. Lorsque vous avez terminé, sélectionnez Appliquer.

calendar

La moitié inférieure de la page affiche des informations sur le nombre d’enregistrements reçus, ingérés et en échec, par exécution de flux. Chaque exécution de flux est enregistrée dans une fenêtre horaire.

dataflow-run

Mesures d’exécution de flux de données dataflow-run-metrics

Chaque exécution de flux de données individuelle affiche les détails suivants :

  • Démarrage de l’exécution du flux de données : l’heure à laquelle le flux de données a commencé.
  • Temps de traitement : temps nécessaire au traitement du flux de données.
  • Enregistrements reçus : nombre total d’enregistrements reçus dans le flux de données d’un connecteur source.
  • Enregistrements ingérés : nombre total d’enregistrements ingérés dans Data Lake.
  • Enregistrements avec avertissements : nombre total d’enregistrements avec avertissements ingérés. Toutes les erreurs de transformation du mappeur sont signalées sous forme d’avertissements et les lignes partiellement ingérées sont marquées comme success avec un avertissement. Remarque : La prise en charge de l’ingestion d’enregistrements avec avertissements est disponible uniquement pour les sources en continu.
  • Échec des enregistrements : nombre d’enregistrements qui n’ont pas été ingérés dans Data Lake en raison d’erreurs dans les données.
  • Taux d’ingestion : taux de succès des enregistrements ingérés dans Data Lake. Cette mesure s’applique lorsque l’option Ingestion partielle est activée.
  • Status : représente l’état du flux de données : Completed ou Processing. Completed signifie que tous les enregistrements de l’exécution de flux de données correspondante ont été traités dans la période d’une heure. Traitement signifie que l’exécution du flux de données n’est pas encore terminée.

La page Présentation de l’exécution du flux de données contient des informations supplémentaires sur votre flux de données, telles que son identifiant d’exécution de flux de données correspondant, son jeu de données cible et son identifiant d’organisation.

Une exécution de flux avec des erreurs contient également le panneau Erreurs d’exécution de flux de données, qui affiche l’erreur particulière qui a conduit à l’échec de l’exécution, ainsi que le nombre total d’enregistrements qui ont échoué.

dataflow-run-overview

Afficher les enregistrements avec avertissements warnings

Enregistrements avec avertissements affiche la liste des avertissements de transformation du mappeur qui se sont produits au cours de votre exécution de flux. Les lignes partiellement ingérées sont considérées comme réussies et sont accompagnées d’avertissements en cas d’erreur de transformation du mappeur.

Par défaut, toutes les erreurs de transformation du mappeur sont considérées comme des avertissements, sauf si elles sont l’une des suivantes :

  • Erreurs de syntaxe
  • Références à des attributs qui n’existent pas
  • Une incohérence des types de données XDM

Pour afficher les diagnostics d’erreur, sélectionnez Preview error diagnostics.

records-with-warning

La fenêtre Aperçu des diagnostics d’erreur vous permet de prévisualiser jusqu’à 100 erreurs et/ou avertissements concernant votre exécution de flux de données. À partir de là, vous pouvez également télécharger le manifeste d’échec d’ingestion pour plus d’informations, à l’aide de l’API Data Access.

diagnostics

Étapes suivantes

En suivant ce tutoriel, vous avez utilisé l’espace de travail Sources pour surveiller vos flux de données en continu et identifier les erreurs qui ont entraîné l’échec des flux de données. Pour plus d’informations, consultez les documents suivants :

recommendation-more-help
337b99bb-92fb-42ae-b6b7-c7042161d089