Surveillance des flux de données pour les sources de flux dans l’interface utilisateur

Ce tutoriel décrit les étapes de surveillance des flux de données pour les sources de diffusion en continu à l’aide du Sources workspace.

Prise en main

Ce tutoriel nécessite une compréhension du fonctionnement des composants suivants d’Adobe Experience Platform :

  • Flux de données : les flux de données sont une représentation des tâches de données qui déplacent ces dernières dans Platform. Les flux de données sont configurés sur différents services, ce qui permet de déplacer les données des connecteurs sources vers des jeux de données cibles, vers Identity et Profile, et vers Destinations.
    • Exécutions de flux de données: les exécutions de flux de données sont les tâches planifiées récurrentes en fonction de la configuration de fréquence des flux de données sélectionnés.
  • Sources : Experience Platform permet d’ingérer des données provenant de diverses sources tout en vous offrant la possibilité de structurer, d’étiqueter et d’améliorer les données entrantes à l’aide des services de Platform.
  • Sandbox : Experience Platform fournit des sandbox virtuels qui divisent une instance de plateforme unique en environnements virtuels distincts pour favoriser le développement et l’évolution d’applications d’expérience digitale.

Surveillance des flux de données pour les sources de diffusion en continu

Dans l’interface utilisateur de Platform, sélectionnez Sources à partir de la barre de navigation de gauche pour accéder à l’espace de travail Sources. L’écran Catalogue affiche diverses sources pour lesquelles vous pouvez créer un compte.

Pour afficher les flux de données existants pour les sources en continu, sélectionnez Flux de données dans l’en-tête supérieur.

catalogue

La variable Flux de données contient une liste de tous les flux de données existants de votre organisation, y compris des informations sur leurs données source, leur nom de compte et leur état d’exécution.

Sélectionnez le nom du flux de données à afficher.

flux de données

Le tableau suivant contient plus d’informations sur les états d’exécution du flux de données :

État
Description
Terminé
La variable Completed Le statut indique que tous les enregistrements de l’exécution de flux de données correspondante ont été traités pendant la période d’une heure. A Completed L’état peut toujours contenir des erreurs lors des exécutions du flux de données.
Réussite
La variable Success Le statut indique que tous les enregistrements de l’exécution de flux de données correspondante ont été traités pendant la période d’une heure et qu’aucune erreur n’a été rencontrée au cours de l’exécution de flux de données.
En cours de traitement
La variable Processing Le statut indique qu’un flux de données n’est pas encore actif. Cet état est souvent rencontré immédiatement après la création d’un nouveau flux de données.
Erreur
La variable Error Le statut indique que le processus d’activation d’un flux de données a été interrompu.
Aucune exécution
La variable No runs L’état indique que le flux de données a été créé mais qu’aucune exécution de flux de données n’a été lancée.

La variable Activité du flux de données affiche des informations spécifiques sur votre flux de données en continu. La bannière supérieure contient le nombre cumulé d’enregistrements ingérés et d’enregistrements ayant échoué pour l’ensemble de vos flux de données de diffusion en continu s’exécutant au cours de la période sélectionnée.

dataflow-activity

Par défaut, les données affichées contiennent les taux d’ingestion des sept derniers jours. Sélectionner 7 derniers jours pour ajuster la période des enregistrements affichés.

Une fenêtre contextuelle de calendrier s’affiche, vous permettant d’accéder à d’autres options de périodes d’ingestion. Vous pouvez configurer la période d’exécution du flux de données pour afficher les exécutions de flux des sept derniers jours ou des 30 derniers jours. Vous pouvez également configurer le calendrier interactif pour définir une période personnalisée de votre choix. Lorsque vous avez terminé, sélectionnez Appliquer.

calendar

La moitié inférieure de la page affiche des informations sur le nombre d’enregistrements reçus, ingérés et en échec, par exécution de flux. Chaque exécution de flux est enregistrée dans une fenêtre horaire.

dataflow-run

Mesures d’exécution de flux de données dataflow-run-metrics

Chaque exécution de flux de données individuelle affiche les détails suivants :

  • Démarrage de l’exécution du flux de données: l’heure à laquelle le flux de données a commencé.
  • Temps de traitement: durée du traitement du flux de données.
  • Enregistrements reçus: nombre total d’enregistrements reçus dans le flux de données d’un connecteur source.
  • Enregistrements ingérés: nombre total d’enregistrements ingérés dans Data Lake.
  • Enregistrements avec avertissement: nombre total d’enregistrements avec des avertissements ingérés. Toutes les erreurs de transformation de mappage sont signalées sous forme d’avertissements et les lignes partiellement ingérées sont marquées comme success avec un avertissement. Remarque: la prise en charge de l’ingestion d’enregistrements avec des avertissements n’est disponible que pour les sources en continu.
  • Enregistrements en échec: nombre d’enregistrements qui n’ont pas été ingérés dans Data Lake en raison d’erreurs dans les données.
  • Taux d’ingestion: taux de succès des enregistrements ingérés dans Data Lake. Cette mesure s’applique lorsque Ingestion partielle est activée.
  • État: représente l’état du flux de données : soit Terminé ou Traitement. Terminé signifie que tous les enregistrements de l’exécution de flux de données correspondante ont été traités dans la période d’une heure. Traitement signifie que l’exécution du flux de données n’est pas encore terminée.

La variable Présentation de l’exécution du flux de données contient des informations supplémentaires sur votre flux de données, telles que l’identifiant d’exécution de flux de données correspondant, le jeu de données cible et l’identifiant d’organisation.

Un flux exécuté avec des erreurs contient également la variable Erreurs d’exécution du flux de données qui affiche l’erreur particulière qui a entraîné l’échec de l’exécution, ainsi que le nombre total d’enregistrements ayant échoué.

dataflow-run-overview

Afficher les enregistrements avec avertissements warnings

Enregistrements avec avertissements affiche la liste des avertissements de transformation du mappeur qui se sont produits au cours de l’exécution du flux. Les lignes partiellement ingérées sont considérées comme réussies et sont accompagnées d’avertissements en cas d’erreur de transformation du mappeur.

Par défaut, toutes les erreurs de transformation du mappeur sont considérées comme des avertissements, sauf si elles sont l’une des suivantes :

  • Erreurs de syntaxe
  • Références à des attributs qui n’existent pas
  • Une incohérence des types de données XDM

Pour afficher les diagnostics d’erreur, sélectionnez Prévisualiser les diagnostics d’erreur.

records-with-warning

La variable Aperçu des diagnostics d’erreur vous permet de prévisualiser jusqu’à 100 erreurs et/ou avertissements concernant l’exécution de votre flux de données. À partir de là, vous pouvez également télécharger le manifeste d’échec d’ingestion pour plus d’informations, en utilisant la variable Data Access API.

diagnostics

Étapes suivantes

En suivant ce tutoriel, vous avez utilisé avec succès la méthode Sources workspace pour surveiller vos flux de données en continu et identifier les erreurs qui ont entraîné l’échec des flux de données. Pour plus d’informations, consultez les documents suivants :

recommendation-more-help
337b99bb-92fb-42ae-b6b7-c7042161d089