Présentation des jeux de données

Toutes les données qui sont correctement ingérées dans Adobe Experience Platform sont conservées dans les Data Lake sous forme de jeux de données. Un jeu de données est une structure de stockage et de gestion pour la collecte de données, généralement sous la forme d’un tableau, qui contient un schéma (des colonnes) et des champs (des lignes). Les jeux de données contiennent également des métadonnées qui décrivent divers aspects des données stockées.

Ce document présente de manière générale les jeux de données dans Experience Platform.

Création de jeux de données et suivi des métadonnées

Catalog Service est le système d’enregistrement de l’emplacement et du lignage des données Experience Platformet est utilisé pour créer et gérer des jeux de données. Catalog suit les métadonnées de chaque jeu de données, ce qui inclut une référence au schéma Experience Data Model (XDM) auquel le jeu de données est conforme (expliqué dans la section suivante) et le nombre d'enregistrements assimilés à ce jeu de données.

Pour plus d’informations, consultez la présentation du service de catalogue.

Application de contraintes aix données des jeux de données

Experience Data Model (XDM) est le cadre normalisé qui Platform organise les données d’expérience client. Toutes les données ingérées dans Platform doivent se conformer à un schéma XDM prédéfini avant de pouvoir être conservées dans le Data Lake en tant que jeu de données.

Tous les jeux de données contiennent une référence au schéma XDM qui limite le format et la structure des données qui peuvent être stockées. Toute tentative de chargement de données vers un jeu de données non conforme à son schéma XDM entraînera l’échec de l’ingestion.

Pour plus d’informations sur XDM, consultez la présentation du système XDM.

Ingestion de données par les jeux de données

L'Ingestion des données Adobe Experience Platform représente les méthodes multiples par lesquelles Platform ingère des données provenant de diverses sources. Quelle que soit la méthode d’ingestion, toutes les données ingérées sont converties en fichiers de lot. Les lots sont des unités de données composées d’un ou de plusieurs fichiers à ingérer en tant qu’unité unique. Ces fichiers de commandes sont ensuite ajoutés aux jeux de données dédiés et conservés dans Data Lake.

Pour plus d’informations, consultez la présentation de Data Ingestion.

Application de libellés d’utilisation aux jeux de données

Adobe Experience Platform Data Governance vous permet de gérer les données client afin de garantir la conformité aux réglementations, restrictions et stratégies applicables à l’utilisation des données. La structure Data Governance vous permet d'appliquer des étiquettes d'utilisation pour classer les données en fonction des stratégies d'utilisation qui s'appliquent à ces données.

Les libellés d’utilisation des données peuvent être appliqués à des jeux de données entiers ou à des champs de jeu de données individuels. Les libellés ajoutés au niveau du jeu de données sont hérités par tous les champs du jeu de données.

Pour plus d’informations sur ce service, consultez la présentation de la gouvernance des données. Pour savoir comment utiliser les libellés d'utilisation dans Platform, consultez les guides suivants :

Jeu de données des services Platform en aval

Une fois que les jeux de données ont été utilisés pour stocker des données imbriquées, ces jeux de données sont ensuite utilisés par les services Platform en aval pour mettre à jour les profils client, obtenir des informations grâce à l'apprentissage automatique, etc.

Voici une liste des services en aval qui utilisent des jeux de données pour diverses opérations. Veuillez consulter la documentation de chaque service pour en savoir plus.

  • Data Access API: Permet d’accéder au contenu des fichiers stockés dans des jeux de données et de le télécharger.
  • Adobe Experience Platform Identity Service : associe les identités des appareils et des systèmes, en liant les jeux de données en fonction des champs d’identité définis par les schémas XDM auxquels ils se conforment.
  • Real-time Customer Profile: Exploite Identity Service pour créer des profils client détaillés à partir de vos jeux de données en temps réel. Real-time Customer Profile extrait les données de Data Lake et conserve les profils clients dans sa propre banque de données distincte.
  • Adobe Experience Platform Segmentation Service Real-time Customer Profile : permet de créer des segments et de générer des audiences à partir de vos données Ces audiences peuvent ensuite être exportées vers leurs propres jeux de données dans le Data Lake.
  • Adobe Experience Platform Data Science Workspace : utilise l’apprentissage automatique et l’intelligence artificielle pour découvrir des insights dans les jeux de données volumineux.
  • Service de Requête Adobe Experience Platform : Vous permet d'utiliser SQL standard pour requête des données dans Experience Platform, de joindre tous les jeux de données dans Data Lake et de capturer les résultats de la requête sous la forme d'un nouveau jeu de données à utiliser dans le rapports, Data Science Workspaceou Real-time Customer Profile.

Étapes suivantes

En lisant ce document, vous avez été initié aux principales utilisations des jeux de données dans Experience Platform, ainsi qu'aux divers services Platform qui utilisent les jeux de données. Pour plus d'informations sur les nombreuses façons d'utiliser les jeux de données dans Platform, veuillez consulter la documentation du service liée dans cet aperçu.

Pour savoir comment interagir avec des jeux de données dans l'interface utilisateur Experience Platform, consultez le guide d'utilisateur des jeux de données.

Sur cette page