Présentation de Catalog Service

Le Catalog Service est le système d’enregistrement pour l’emplacement et la parenté des données au sein d’Adobe Experience Platform. Bien que toutes les données ingérées dans Experience Platform soient stockées dans le Data Lake sous forme de fichiers et de répertoires, le Catalog renferme les métadonnées et la description de ces fichiers et répertoires à des fins de recherche et de surveillance.

En d’autres termes, le Catalog fait office de banque de métadonnées ou de « catalogue » qui vous permet de trouver des informations sur vos données dans Experience Platform. Vous pouvez utiliser le Catalog pour répondre aux questions suivantes :

  • Où se trouvent mes données ?
  • À quel stade de traitement ces données sont-elles arrivées ?
  • Par quels systèmes ou processus mes données sont-elles passées ?
  • Quelle quantité de données a été traitée avec succès ?
  • Quelles erreurs se sont produites pendant le traitement ?

Le Catalog propose une API RESTful qui vous permet de gérer par programmation les métadonnées de Platform à l’aide des opérations CRUD de base. Pour plus d’informations, consultez le guide de développement du catalogue.

Catalog et les services de Experience Platform

Les ressources suivies par le Catalog Service sont utilisées par plusieurs services Experience Platform. Afin de tirer le meilleur parti des fonctionnalités du Catalog’s, il vous est recommandé de vous familiariser avec ces services et de connaître leurs interactions avec le Catalog.

Système d’Experience Data Model (XDM)

Le système d’ Experience Data Model (XDM) constitue le cadre normalisé à partir duquel Platform organise les données d’expérience client. Experience Platform tire parti des schémas XDM pour décrire la structure des données de manière cohérente et réutilisable.

Lorsque des données sont ingérées dans Platform, leur structure est mappée vers un schéma XDM et stockée dans le Data Lake comme partie intégrante d’un jeu de données. Les métadonnées de chaque jeu de données sont suivies par le Catalog Service, qui inclut une référence au schéma XDM auquel le jeu de données est conforme.

Pour obtenir des informations générales sur le système XDM, consultez la présentation du système XDM.

Data Ingestion

Experience Platform ingère des données provenant de plusieurs sources et conserve les enregistrements en tant que jeux de données dans le Data Lake. Le Catalog suit les métadonnées de ces jeux de données, quelle que soit leur source ou leur méthode d’ingestion.

Lors de l’utilisation de la méthode d’ingestion par lots, le Catalog réalise également le suivi de métadonnées supplémentaires pour les fichiers de lots. Les lots sont des unités de données composées d’un ou de plusieurs fichiers à ingérer en tant qu’unité unique. Le Catalog effectue le suivi des métadonnées de ces fichiers de lots, ainsi que des jeux de données dans lesquels ils sont conservés après ingestion. Les métadonnées de lot contiennent des informations sur le nombre d’enregistrements correctement ingérés, ainsi que sur les enregistrements ayant échoué et les messages d’erreur associés.

Pour plus d’informations, consultez la Présentation de l’ingestion de données.

Objets du Catalog

Comme indiqué dans la section précédente, le Catalog réalise le suivi des métadonnées pour plusieurs types de ressources et d’opérations utilisées par d’autres services Platform. Le Catalog conserve sa propre banque d’« objets » contenant ces métadonnées. Les objets du Catalog sont des représentations interrogeables des Platform données de qui vous permettent de rechercher, surveiller et étiqueter vos données sans avoir à accéder aux données elles-mêmes.

Le tableau suivant décrit les différents types d’objets pris en charge par le Catalog :

Objet
Point d’entrée de l’API
Définition
Lot
/batches
Les lots sont des unités de données composées d’un ou de plusieurs fichiers à ingérer en tant qu’unité unique. Un objet de lot dans le Catalog décrit les mesures d’ingestion du lot, telles que le nombre d’enregistrements traités ou la taille sur le disque. Il peut également inclure des liens vers des jeux de données, des vues et d’autres ressources que l’opération par lot a affectées.
Jeu de données
/dataSets
Un jeu de données est une structure de stockage et de gestion utilisée pour la collecte de données (généralement sous la forme d’un tableau) qui contient un schéma (des colonnes) et des champs (des lignes). Pour plus d’informations, consultez la présentation des jeux de données.
Fichier de jeu de données
/datasetFiles
Les fichiers de jeux de données représentent des blocs de données qui ont été enregistrés sur Platform. Étant des enregistrements de fichiers littéraux, vous pouvez y trouver la taille du fichier, le nombre d’enregistrements qu’il contient, ainsi qu’une référence au lot qui a ingéré le fichier.

Étapes suivantes

Ce document vous a présenté le Catalog Service et son fonctionnement dans le cadre plus large du système Experience Platform. Pour savoir comment interagir avec les différents points d’entrée de cette API du Catalog, consultez le guide de développement du Catalog. Il vous est également recommandé de consulter le guide sur le filtrage des données du catalogue afin de suivre les bonnes pratiques de limitation des données renvoyées dans les réponses de l’API.

recommendation-more-help
c5c02be6-79a3-4a2f-b766-136bffe8b676