Présentation des jeux de données

Toutes les données correctement ingérées par Adobe Experience Platform sont conservées sous forme de jeux de données dans le Data Lake. Un jeu de données est une structure de stockage et de gestion pour la collecte de données, généralement sous la forme d’un tableau, qui contient un schéma (des colonnes) et des champs (des lignes). Les jeux de données contiennent également des métadonnées qui décrivent divers aspects des données stockées.

Ce document présente de manière générale les jeux de données dans Experience Platform.

Créer des jeux de données et suivre des métadonnées

Catalog Service est le système d’enregistrement pour l’emplacement et la traçabilité des données dans Experience Platform. Il sert à créer et à gérer les jeux de données. Catalog suit les métadonnées de chaque jeu de données, ce qui inclut une référence au schéma Experience Data Model (XDM) auquel le jeu de données se conforme (expliqué dans la section suivante) et le nombre d’enregistrements ingérés par ce jeu de données.

Pour plus d’informations, consultez la présentation du service de catalogue.

Application de contraintes aix données des jeux de données

Experience Data Model (XDM) constitue le cadre normalisé à partir duquel Platform organise les données d’expérience client. Toutes les données ingérées par Platform doivent être conformes à un schéma XDM prédéfini avant de pouvoir être conservées sous la forme d’un jeu de données dans le Data Lake.

Tous les jeux de données contiennent une référence au schéma XDM qui limite le format et la structure des données qui peuvent être stockées. Toute tentative de chargement de données vers un jeu de données non conforme à son schéma XDM entraînera l’échec de l’ingestion.

Pour plus d’informations sur XDM, consultez la présentation du système XDM.

Ingestion de données par les jeux de données

Adobe Experience Platform Data Ingestion représente les différentes méthodes par lesquelles Platform ingère les données de diverses sources. Quelle que soit la méthode d’ingestion, toutes les données ingérées sont converties en fichiers de lot. Les lots sont des unités de données composées d’un ou de plusieurs fichiers à ingérer en tant qu’unité unique. Ces fichiers de lot sont ensuite ajoutés aux jeux de données dédiés et conservés dans le Data Lake.

Pour plus d’informations, consultez la présentation de Data Ingestion.

Étiquettes appliquées aux jeux de données des schémas

La gouvernance des données d’Adobe Experience Platform vous permet de gérer les données clients et de garantir la conformité aux réglementations, aux restrictions et aux politiques applicables à l’utilisation des données. Le cadre de gouvernance des données vous permet d’appliquer des libellés d’utilisation pour classer les données en fonction des stratégies d’utilisation qui s’appliquent à ces données. Les libellés peuvent être appliqués à des schémas individuels, à des champs de ces schémas et à des jeux de données individuels entiers. Lorsque des libellés sont appliqués directement à un schéma, ces libellés sont propagés à tous les jeux de données existants et futurs basés sur ce schéma.

IMPORTANT
Les libellés ne peuvent plus être appliqués aux champs au niveau du jeu de données. Ce workflow a été abandonné au profit de l’application des libellés au niveau du schéma. Les libellés précédemment appliqués au niveau de l’objet du jeu de données seront toujours pris en charge par l’interface utilisateur de Platform jusqu’au 31 mai 2024. Pour garantir la cohérence de vos libellés sur tous les schémas, les libellés précédemment attachés aux champs au niveau du jeu de données doivent être migrés au niveau du schéma par vous-même au cours de l’année à venir. Consultez la section sur la migration des libellés précédemment appliqués pour connaitre la procédure à suivre.

Pour plus d’informations sur ce service, consultez la présentation de la gouvernance des données. Pour savoir comment utiliser les étiquettes d’utilisation dans Platform, reportez-vous aux guides suivants :

Jeux de données dans les services Platform en aval

Une fois que les jeux de données ont été utilisés pour stocker les données ingérées, ils sont utilisés par les services Platform en aval pour mettre à jour les profils clients, obtenir des informations grâce au machine learning, etc.

Voici une liste des services en aval qui utilisent des jeux de données pour diverses opérations. Veuillez consulter la documentation de chaque service pour en savoir plus.

  • Data Access API : vous permet d’accéder au contenu des fichiers stockés dans les jeux de données et de le télécharger.
  • Service d’identités d’Adobe Experience Platform : associe les identités des appareils et des systèmes, en liant les jeux de données en fonction des champs d’identité définis par les schémas XDM auxquels ils se conforment.
  • Real-Time Customer Profile : tire parti de Identity Service pour créer des profils client détaillés à partir de vos jeux de données en temps réel. Real-Time Customer Profile extrait les données du Data Lake et conserve les profils clients dans sa propre banque de données distincte.
  • Adobe Experience Platform Segmentation Service : permet de créer des segments et de générer des audiences à partir de vos données Real-Time Customer Profile. Ces audiences peuvent ensuite être exportées vers leurs propres jeux de données dans le Data Lake.
  • Espace de travail de science des données d’Adobe Experience Platform : utilise le machine learning et l’intelligence artificielle pour découvrir des informations dans les jeux de données volumineux.
  • Adobe Experience Platform Query Service : vous permet d’utiliser une requête SQL standard pour interroger les données dans Experience Platform. Il peut joindre n’importe quel jeu de données dans le Data Lake et capturer les résultats de la requête sous la forme d’un nouveau jeu de données à utiliser pour le reporting, Data Science Workspace, ou Real-Time Customer Profile.
  • Service de destinations d’Adobe Experience Platform : vous permet d’exporter des jeux de données vers les destinations de stockage dans le cloud ou de marketing par e-mail de votre choix, pour les activités de création de rapports ou de science des données.

Étapes suivantes

En lisant ce document, vous avez découvert les principales utilisations des jeux de données dans Experience Platform, ainsi que les différents services de Platform qui utilisent les jeux de données. Pour plus d’informations sur les nombreuses façons dont les jeux de données sont utilisés dans Platform, consultez les liens vers la documentation des services.

Pour savoir comment interagir avec les jeux de données dans l’interface utilisateur de Experience Platform, consultez le guide d’utilisation des jeux de données.

recommendation-more-help
c5c02be6-79a3-4a2f-b766-136bffe8b676