Présentation des jeux de données

Toutes les données correctement ingérées dans Adobe Experience Platform sont conservées sous la forme de jeux de données dans Data Lake. Un jeu de données est une structure de stockage et de gestion pour la collecte de données, généralement sous la forme d’un tableau, qui contient un schéma (des colonnes) et des champs (des lignes). Les jeux de données contiennent également des métadonnées qui décrivent divers aspects des données stockées.

Ce document présente de manière générale les jeux de données dans Experience Platform.

Création de jeux de données et suivi des métadonnées

Catalog Service est le système d’enregistrement de l’emplacement et de la traçabilité des données dans Experience Platform. Il est utilisé pour créer et gérer des jeux de données. Catalog effectue le suivi des métadonnées de chaque jeu de données, qui incluent une référence au schéma Experience Data Model (XDM) auquel le jeu de données se conforme (expliqué dans la section suivante) et le nombre d’enregistrements ingérés dans ce jeu de données.

Pour plus d’informations, consultez la présentation du service de catalogue.

Application de contraintes aix données des jeux de données

Experience Data Model (XDM) est le cadre normalisé selon lequel Platform organise les données d’expérience client. Toutes les données ingérées dans Platform doivent être conformes à un schéma XDM prédéfini avant de pouvoir être conservées dans Data Lake en tant que jeu de données.

Tous les jeux de données contiennent une référence au schéma XDM qui limite le format et la structure des données qui peuvent être stockées. Toute tentative de chargement de données vers un jeu de données non conforme à son schéma XDM entraînera l’échec de l’ingestion.

Pour plus d’informations sur XDM, consultez la présentation du système XDM.

Ingestion de données par les jeux de données

Adobe Experience Platform Data Ingestion représente les méthodes multiples par lesquelles Platform ingère des données provenant de diverses sources. Quelle que soit la méthode d’ingestion, toutes les données ingérées sont converties en fichiers de lot. Les lots sont des unités de données composées d’un ou de plusieurs fichiers à ingérer en tant qu’unité unique. Ces fichiers de lot sont ensuite ajoutés aux jeux de données dédiés et conservés dans la balise Data Lake.

Pour plus d’informations, consultez la présentation de Data Ingestion.

Application de libellés d’utilisation aux jeux de données

Adobe Experience Platform Data Governance vous permet de gérer les données client afin de garantir la conformité aux réglementations, aux restrictions et aux politiques applicables à l’utilisation des données. La structure Data Governance vous permet d’appliquer des libellés d’utilisation pour classer les données en fonction des stratégies d’utilisation qui s’appliquent à ces données.

Les libellés d’utilisation des données peuvent être appliqués à des jeux de données entiers ou à des champs de jeu de données individuels. Les libellés ajoutés au niveau du jeu de données sont hérités par tous les champs du jeu de données.

Pour plus d’informations sur ce service, consultez la présentation de la gouvernance des données. Pour savoir comment utiliser les libellés d’utilisation dans Platform, reportez-vous aux guides suivants :

Jeux de données dans les services Platform en aval

Une fois que les jeux de données ont été utilisés pour stocker les données ingérées, ces jeux de données sont ensuite utilisés par les services Platform en aval pour mettre à jour les profils client, obtenir des informations grâce à l’apprentissage automatique, etc.

Voici une liste des services en aval qui utilisent des jeux de données pour diverses opérations. Veuillez consulter la documentation de chaque service pour en savoir plus.

  • Data Access API: Permet d’accéder au contenu des fichiers stockés dans les jeux de données et de le télécharger.
  • Adobe Experience Platform Identity Service : associe les identités des appareils et des systèmes, en liant les jeux de données en fonction des champs d’identité définis par les schémas XDM auxquels ils se conforment.
  • Real-time Customer Profile: Utilise Identity Service pour créer des profils client détaillés à partir de vos jeux de données en temps réel. Real-time Customer Profile extrait les données de Data Lake et conserve les profils client dans son propre magasin de données distinct.
  • Adobe Experience Platform Segmentation Service Real-time Customer Profile : permet de créer des segments et de générer des audiences à partir de vos données Ces audiences peuvent ensuite être exportées vers leurs propres jeux de données dans Data Lake.
  • Adobe Experience Platform Data Science Workspace : utilise l’apprentissage automatique et l’intelligence artificielle pour découvrir des insights dans les jeux de données volumineux.
  • Adobe Experience Platform Query Service : Permet d’utiliser du code SQL standard pour interroger des données dans Experience Platform, joindre n’importe quel jeu de données dans Data Lake et capturer les résultats de requête sous la forme d’un nouveau jeu de données à utiliser dans les rapports, Data Science Workspace ou Real-time Customer Profile.

Étapes suivantes

En lisant ce document, vous avez découvert les principales utilisations des jeux de données dans Experience Platform, ainsi que les différents services Platform qui utilisent des jeux de données. Pour plus d’informations sur les nombreuses façons dont les jeux de données sont utilisés dans Platform, consultez la documentation du service liée tout au long de cette présentation.

Pour savoir comment interagir avec les jeux de données dans l’interface utilisateur Experience Platform, consultez le guide d’utilisation des jeux de données.

Sur cette page