Catalog et les services de Experience Platform

Les ressources suivies par le Catalog Service sont utilisées par plusieurs services Experience Platform. Afin de tirer le meilleur parti des fonctionnalités du Catalog’s, il vous est recommandé de vous familiariser avec ces services et de connaître leurs interactions avec le Catalog.

Système d’Experience Data Model (XDM)

Le système d’ Experience Data Model (XDM) constitue le cadre normalisé à partir duquel Experience Platform organise les données d’expérience client. Experience Platform tire parti des schémas XDM pour décrire la structure des données de manière cohérente et réutilisable.

Lorsque des données sont ingérées dans Experience Platform, leur structure est mappée vers un schéma XDM et stockée dans le Data Lake comme partie intégrante d’un jeu de données. Les métadonnées de chaque jeu de données sont suivies par le Catalog Service, qui inclut une référence au schéma XDM auquel le jeu de données est conforme.

Pour obtenir des informations générales sur le système XDM, consultez la présentation du système XDM.

Data Ingestion

Experience Platform ingère des données provenant de plusieurs sources et conserve les enregistrements en tant que jeux de données dans le Data Lake. Le Catalog suit les métadonnées de ces jeux de données, quelle que soit leur source ou leur méthode d’ingestion.

Lors de l’utilisation de la méthode d’ingestion par lots, le Catalog réalise également le suivi de métadonnées supplémentaires pour les fichiers de lots. Les lots sont des unités de données composées d’un ou de plusieurs fichiers à ingérer en tant qu’unité unique. Le Catalog effectue le suivi des métadonnées de ces fichiers de lots, ainsi que des jeux de données dans lesquels ils sont conservés après ingestion. Les métadonnées de lot contiennent des informations sur le nombre d’enregistrements correctement ingérés, ainsi que sur les enregistrements ayant échoué et les messages d’erreur associés.

Pour plus d’informations, consultez la Présentation de l’ingestion de données.

Objets du Catalog

Comme indiqué dans la section précédente, le Catalog réalise le suivi des métadonnées pour plusieurs types de ressources et d’opérations utilisées par d’autres services Experience Platform. Le Catalog conserve sa propre banque d’« objets » contenant ces métadonnées. Les objets du Catalog sont des représentations interrogeables des Experience Platform données de qui vous permettent de rechercher, surveiller et étiqueter vos données sans avoir à accéder aux données elles-mêmes.

Le tableau suivant décrit les différents types d’objets pris en charge par le Catalog :

ObjetPoint d’entrée de l’APIDéfinition
Lot/batchesLes lots sont des unités de données composées d’un ou de plusieurs fichiers à ingérer en tant qu’unité unique. Un objet de lot dans le Catalog décrit les mesures d’ingestion du lot, telles que le nombre d’enregistrements traités ou la taille sur le disque. Il peut également inclure des liens vers des jeux de données, des vues et d’autres ressources que l’opération par lot a affectées.
Jeu de données/dataSetsUn jeu de données est une structure de stockage et de gestion utilisée pour la collecte de données (généralement sous la forme d’un tableau) qui contient un schéma (des colonnes) et des champs (des lignes). Pour plus d’informations, consultez la présentation des jeux de données.
Fichier de jeu de données/datasetFilesLes fichiers de jeux de données représentent des blocs de données qui ont été enregistrés sur Experience Platform. Étant des enregistrements de fichiers littéraux, vous pouvez y trouver la taille du fichier, le nombre d’enregistrements qu’il contient, ainsi qu’une référence au lot qui a ingéré le fichier.

Étapes suivantes

Ce document vous a présenté le Catalog Service et son fonctionnement dans le cadre plus large du système Experience Platform. Pour savoir comment interagir avec les différents points d’entrée de cette API du Catalog, consultez le guide de développement du Catalog. Il vous est également recommandé de consulter le guide sur le filtrage des données du catalogue afin de suivre les bonnes pratiques de limitation des données renvoyées dans les réponses de l’API.