Présentation de Data Ingestion

Dans Adobe Experience Platform, l’ingestion de données est le transport de données provenant de sources variées vers un support de stockage où elles peuvent être accessibles, utilisées et analysées par une organisation. Dans Experience Platform, l’ingestion de données peut être regroupée en deux catégories principales : ingestion par flux et ingestion par lots.

Sous ingestion par lots et en flux continu , vous pouvez utiliser plusieurs méthodes différentes pour ingérer vos données dans Experience Platform. Ces méthodes incluent l’utilisation de diverses sources et la connexion à ces sources pour importer ensuite des données dans Experience Platform.

Lisez ce document pour obtenir un aperçu des nombreuses façons dont les données peuvent être ingérées dans Experience Platform.

Ingestion en flux continu streaming

Vous pouvez utiliser l’ingestion par flux pour envoyer en temps réel des données à Experience Platform à partir d’appareils côté client et côté serveur. Experience Platform prend en charge l’utilisation des entrées de données pour diffuser des données d’expérience entrantes, qui sont conservées dans les jeux de données activés dans le flux au sein du lac de données. Les entrées de données peuvent être configurées pour authentifier automatiquement les données qu’elles collectent, en veillant à ce que celles-ci proviennent d’une source approuvée.

Pour plus d’informations, consultez la présentation de l’ingestion en flux continu.

Ingestion par lots batch

Dans Experience Platform, un lot est un ensemble de données collectées sur une période de temps et traitées ensemble comme une seule unité. Les jeux de données sont constitués de lots. Vous pouvez utiliser l’ingestion par lots pour ingérer des données dans Experience Platform sous forme de fichiers de lots. Une fois ingérés, les lots fournissent des métadonnées qui décrivent le nombre d’enregistrements correctement ingérés ainsi que les enregistrements ayant échoué et les messages d’erreur associés.

Les fichiers de données chargés manuellement, tels que les fichiers CSV plats (mappés à des schémas XDM) et les fichiers parquet, doivent être ingérés à l’aide de cette méthode.

Pour plus d’informations, consultez la présentation de l’ingestion par lots.

Sources sources

Vous pouvez également ingérer des données en vous connectant aux sources Experience Platform. Experience Platform conserve un catalogue de différentes sources de données auxquelles vous pouvez vous connecter et à partir desquelles vous pouvez ingérer des données. Ces sources peuvent être des applications Adobe natives telles que la source Adobe Analytics ou la source Marketo Engage. Vous pouvez également vous connecter à des sources tierces telles que la source de Amazon S3 et la source de Google Cloud Storage.

Les sources sont regroupées en différentes catégories, telles que les stockages dans le cloud, les bases de données et les systèmes CRM. Une source donnée peut prendre en charge l’ingestion par lots ou par flux.

Avec les sources, vous pouvez ingérer des données provenant de plusieurs sources de données différentes et de différentes catégories de cas d’utilisation. En outre, l’ingestion de données via une source vous donne la possibilité de vous authentifier auprès de la source de données externe, de configurer un planning d’ingestion et de gérer le débit d’ingestion.

Pour plus d’informations, reportez-vous à la présentation des sources.

Création de schémas assistée par ML ml-assisted-schema-creation

Pour intégrer rapidement de nouvelles sources de données, vous pouvez désormais utiliser des algorithmes de machine learning pour générer un schéma à partir de données d’exemple. Cette automatisation simplifie la création de schémas précis, réduit les erreurs et accélère le processus de la collecte de données à l’analyse et aux informations.

Pour plus d’informations sur ce workflow🔗 consultez le guide de création de schéma assistée par machine learning .

Préparation des données data-prep

Bien que la préparation des données ne soit pas une méthode d’ingestion, elle constitue une partie importante du processus d’ingestion des données. Utilisez les fonctions de préparation de données pour mapper, transformer et valider les données vers et depuis le modèle de données d’expérience (XDM) avant de créer un flux de données pour ingérer vos données dans Experience Platform. La préparation des données apparaît comme l’étape de « mappage » dans l’interface utilisateur d’Experience Platform au cours du processus d’ingestion des données.

Pour plus d’informations, consultez la présentation de la préparation des données.

Méthodes d’ingestion en flux continu streaming-ingestion-methods

Le tableau suivant décrit les différentes méthodes que vous pouvez utiliser pour ingérer des données de flux vers Experience Platform.

Sources de streaming
Méthode
Cas d’utilisation courants
Protocoles
Considérations
Adobe Web/Mobile SDK
  • Collecte de données à partir de sites web et d’applications mobiles.
  • Méthode préférée pour la collecte côté client.
Notification push, HTTP, JSON
  • Implémentez plusieurs applications Adobe à l’aide d’un seul SDK.
Connecteur API HTTP
  • Collecte à partir de sources en flux continu, de transactions, d’événements et de signaux clients pertinents.
Notification push, API REST, JSON
  • Les données brutes ou XDM sont diffusées directement vers le hub, sans segmentation Edge en temps réel ni transfert d’événement.
Edge Network API
  • Collecte à partir de sources en flux continu, de transactions, d’événements clients pertinents et de signaux provenant de l’Edge Network distribué dans le monde.
Notification push, API REST, JSON
  • Les données sont diffusées en continu via le Edge Network. Prise en charge de la segmentation en temps réel et du transfert d’événement sur Edge.
Applications Adobe
  • Ingestion de données à partir d’applications telles qu’Adobe Analytics, Marketo Engage, Adobe Campaign Managed Services, Adobe Target, Adobe Audience Manager
Notification push, connecteurs Source et API
  • L’approche recommandée consiste à migrer vers le SDK Web/Mobile au lieu d’utiliser les SDK d’application traditionnels.
Sources de streaming
  • Ingestion d’un flux d’événement d’entreprise, généralement utilisé pour partager des données d’entreprise avec plusieurs applications en aval.
Notification push, API REST, JSON
  • Les données sont diffusées en continu au format JSON et peuvent être mappées au schéma XDM.

SDK des sources en flux continu

  • Utilisez les fonctionnalités en libre-service de la diffusion en continu de sources en libre-service SDK pour intégrer votre propre source de données au catalogue de sources Experience Platform.
Push, API HTTP, JSON
  • Parmi les exemples de sources de streaming intégrées par les partenaires, citons : Braze, Pendo et RainFocus.

Méthodes d’ingestion par lots batch-ingestion-methods

Le tableau suivant décrit les différentes méthodes que vous pouvez utiliser pour ingérer des données par lots vers Experience Platform.

Sources de lot
Méthode
Cas d’utilisation courants
Protocoles
Considérations
API Batch Ingestion
  • Ingestion depuis une file d’attente gérée par l’entreprise. Utilisez l’ingestion par lots si vos données doivent être préparées et formatées avant l’ingestion.
Notification push, JSON ou Parquet
  • Ils doivent gérer les lots et les fichiers pour l’ingestion.
Sources de lot
  • Approche courante pour l’ingestion de données provenant d’applications de stockage dans le cloud, de gestion de la relation client et d’automatisation marketing.
  • Idéal pour ingérer de grandes quantités de données historiques.
Pull, CSV, JSON, Parquet
  • Ingestion de Source basée sur des intervalles planifiés préconfigurés.
Zone d’atterrissage des données
  • Stockage de fichiers dans le cloud configuré par Adobe. Vous avez accès à un conteneur Data Landing Zone par sandbox.
  • Envoyez vos fichiers dans la zone d’atterrissage de données pour une ingestion ultérieure dans Experience Platform.
Push, CSV, JSON, Parquet
  • Experience Platform applique un délai d’expiration strict de sept jours sur tous les fichiers et dossiers chargés dans un conteneur Data Landing Zone. Tous les fichiers et les dossiers sont supprimés au bout de sept jours.
SDK des sources par lots
  • Utilisez les fonctionnalités en libre-service du SDK par lots des sources en libre-service pour intégrer votre propre source de données au catalogue des sources Experience Platform.
  • Idéal pour les connecteurs partenaires ou pour une expérience de workflow personnalisée pour configurer un connecteur d’entreprise.
Extraction, API REST, CSV ou JSON
  • Mailchimp, OneTrust, Zendesk sont des exemples de sources de lots intégrées par les partenaires

Étapes suivantes et ressources supplémentaires

Ce document vous a présenté brièvement les différents aspects de Data Ingestion dans Experience Platform. Poursuivez votre lecture de la documentation de présentation de chaque méthode d’ingestion pour vous familiariser avec leurs différentes capacités, les cas d’utilisation et les bonnes pratiques. Vous pouvez également compléter votre apprentissage en regardant la vidéo de présentation de lʼingestion ci-dessous. Pour en savoir plus sur la manière dont Experience Platform suit les métadonnées pour les enregistrements ingérés, reportez-vous à la présentation du service de catalogue.

WARNING
Le terme « Profil unifié » utilisé dans la vidéo suivante est obsolète. Les termes “Profile” ou “Real-Time Customer Profile” sont les termes appropriés utilisés dans la documentation dʼExperience Platform. Reportez-vous à la documentation pour connaître les dernières fonctionnalités.
recommendation-more-help
2ee14710-6ba4-4feb-9f79-0aad73102a9a