Ingestion par lots

Dans Experience Platform, un lot est un ensemble de données collectées sur une période de temps et traitées ensemble comme une seule unité. Les jeux de données sont constitués de lots. Vous pouvez utiliser l’ingestion par lots pour ingérer des données dans Experience Platform sous forme de fichiers de lots. Une fois ingérés, les lots fournissent des métadonnées qui décrivent le nombre d’enregistrements correctement ingérés ainsi que les enregistrements ayant échoué et les messages d’erreur associés.

Les fichiers de données chargés manuellement, tels que les fichiers CSV plats (mappés à des schémas XDM) et les fichiers parquet, doivent être ingérés à l’aide de cette méthode.

Pour plus d’informations, consultez la présentation de l’ingestion par lots.

Sources

Vous pouvez également ingérer des données en vous connectant aux sources Experience Platform. Experience Platform conserve un catalogue de différentes sources de données auxquelles vous pouvez vous connecter et à partir desquelles vous pouvez ingérer des données. Ces sources peuvent être des applications Adobe natives telles que la source Adobe Analytics ou la source Marketo Engage. Vous pouvez également vous connecter à des sources tierces telles que la source de Amazon S3 et la source de Google Cloud Storage.

Les sources sont regroupées en différentes catégories, telles que les stockages dans le cloud, les bases de données et les systèmes CRM. Une source donnée peut prendre en charge l’ingestion par lots ou par flux.

Avec les sources, vous pouvez ingérer des données provenant de plusieurs sources de données différentes et de différentes catégories de cas d’utilisation. En outre, l’ingestion de données via une source vous donne la possibilité de vous authentifier auprès de la source de données externe, de configurer un planning d’ingestion et de gérer le débit d’ingestion.

Pour plus d’informations, reportez-vous à la présentation des sources.

Création de schémas assistée par ML

Pour intégrer rapidement de nouvelles sources de données, vous pouvez désormais utiliser des algorithmes de machine learning pour générer un schéma à partir de données d’exemple. Cette automatisation simplifie la création de schémas précis, réduit les erreurs et accélère le processus de la collecte de données à l’analyse et aux informations.

Pour plus d’informations sur ce workflow🔗 consultez le guide de création de schéma assistée par machine learning .

Préparation des données

Bien que la préparation des données ne soit pas une méthode d’ingestion, elle constitue une partie importante du processus d’ingestion des données. Utilisez les fonctions de préparation de données pour mapper, transformer et valider les données vers et depuis le modèle de données d’expérience (XDM) avant de créer un flux de données pour ingérer vos données dans Experience Platform. La préparation des données apparaît comme l’étape de « mappage » dans l’interface utilisateur d’Experience Platform au cours du processus d’ingestion des données.

Pour plus d’informations, consultez la présentation de la préparation des données.

Méthodes d’ingestion en flux continu

Le tableau suivant décrit les différentes méthodes que vous pouvez utiliser pour ingérer des données de flux vers Experience Platform.

Sources de streaming
MéthodeCas d’utilisation courantsProtocolesConsidérations
Adobe Web/Mobile SDK
  • Collecte de données à partir de sites web et d’applications mobiles.
  • Méthode préférée pour la collecte côté client.
Notification push, HTTP, JSON
  • Implémentez plusieurs applications Adobe à l’aide d’un seul SDK.
Connecteur API HTTP
  • Collecte à partir de sources en flux continu, de transactions, d’événements et de signaux clients pertinents.
Notification push, API REST, JSON
  • Les données brutes ou XDM sont diffusées directement vers le hub, sans segmentation Edge en temps réel ni transfert d’événement.
Edge Network API
  • Collecte à partir de sources en flux continu, de transactions, d’événements clients pertinents et de signaux provenant de l’Edge Network distribué dans le monde.
Notification push, API REST, JSON
  • Les données sont diffusées en continu via le Edge Network. Prise en charge de la segmentation en temps réel et du transfert d’événement sur Edge.
Applications Adobe
  • Ingestion de données à partir d’applications telles qu’Adobe Analytics, Marketo Engage, Adobe Campaign Managed Services, Adobe Target, Adobe Audience Manager
Notification push, connecteurs Source et API
  • L’approche recommandée consiste à migrer vers le SDK Web/Mobile au lieu d’utiliser les SDK d’application traditionnels.
Sources de streaming
  • Ingestion d’un flux d’événement d’entreprise, généralement utilisé pour partager des données d’entreprise avec plusieurs applications en aval.
Notification push, API REST, JSON
  • Les données sont diffusées en continu au format JSON et peuvent être mappées au schéma XDM.

SDK des sources en flux continu

  • Utilisez les fonctionnalités en libre-service de la diffusion en continu de sources en libre-service SDK pour intégrer votre propre source de données au catalogue de sources Experience Platform.
Push, API HTTP, JSON
  • Parmi les exemples de sources de streaming intégrées par les partenaires, citons : Braze, Pendo et RainFocus.

Méthodes d’ingestion par lots

Le tableau suivant décrit les différentes méthodes que vous pouvez utiliser pour ingérer des données par lots vers Experience Platform.

Sources de lot
MéthodeCas d’utilisation courantsProtocolesConsidérations
API Batch Ingestion
  • Ingestion depuis une file d’attente gérée par l’entreprise. Utilisez l’ingestion par lots si vos données doivent être préparées et formatées avant l’ingestion.
Notification push, JSON ou Parquet
  • Ils doivent gérer les lots et les fichiers pour l’ingestion.
Sources de lot
  • Approche courante pour l’ingestion de données provenant d’applications de stockage dans le cloud, de gestion de la relation client et d’automatisation marketing.
  • Idéal pour ingérer de grandes quantités de données historiques.
Pull, CSV, JSON, Parquet
  • Ingestion de Source basée sur des intervalles planifiés préconfigurés.
Zone d’atterrissage des données
  • Stockage de fichiers dans le cloud configuré par Adobe. Vous avez accès à un conteneur Data Landing Zone par sandbox.
  • Envoyez vos fichiers dans la zone d’atterrissage de données pour une ingestion ultérieure dans Experience Platform.
Push, CSV, JSON, Parquet
  • Experience Platform applique un délai d’expiration strict de sept jours sur tous les fichiers et dossiers chargés dans un conteneur Data Landing Zone. Tous les fichiers et les dossiers sont supprimés au bout de sept jours.
SDK des sources par lots
  • Utilisez les fonctionnalités en libre-service du SDK par lots des sources en libre-service pour intégrer votre propre source de données au catalogue des sources Experience Platform.
  • Idéal pour les connecteurs partenaires ou pour une expérience de workflow personnalisée pour configurer un connecteur d’entreprise.
Extraction, API REST, CSV ou JSON
  • Mailchimp, OneTrust, Zendesk sont des exemples de sources de lots intégrées par les partenaires