Création d’un flux de données à l’aide d’une source d’analyse dans l’interface utilisateur

Un flux de données est une tâche planifiée qui récupère et ingère des données d’une source vers un jeu de données dans Adobe Experience Platform. Ce tutoriel explique comment créer un flux de données pour une source d’analyse à l’aide de l’interface utilisateur de Platform.

NOTE
Pour créer un flux de données, vous devez déjà disposer d’un compte authentifié avec la variable Mixpanel source. Voir le tutoriel sur création d’un Mixpanel connexion source dans l’interface utilisateur pour plus d’informations.

Prise en main

Ce tutoriel nécessite une compréhension du fonctionnement des composants suivants d’Adobe Platform :

  • Sources : Platform permet d’ingérer des données provenant de diverses sources tout en vous offrant la possibilité de structurer, d’étiqueter et d’améliorer les données entrantes à l’aide des services de Platform.

  • Experience Data Model (XDM) Système : Cadre normalisé selon lequel Experience Platform organise les données d’expérience client.

  • Real-Time Customer Profile : fournit un profil de consommateur unifié en temps réel, basé sur des données agrégées provenant de plusieurs sources.

  • Data Prep: permet aux ingénieurs de données de mapper, de transformer et de valider des données vers et depuis le modèle de données d’expérience (XDM).

Fournir des détails sur le flux de données

La page Détails du flux de données vous permet de choisir si vous souhaitez utiliser un jeu de données existant ou un nouveau jeu de données. Au cours de ce processus, vous pouvez également configurer les paramètres de Jeu de données de profil, Diagnostics d’erreur, Ingestion partielle et Alertes.

dataflow-detail

Utiliser un jeu de données existant

Pour ingérer vos données dans un jeu de données existant, sélectionnez Jeu de données existant. Vous pouvez soit récupérer un jeu de données existant à l’aide de l’option de Recherche avancée, soit faire défiler la liste des jeux de données existants dans le menu déroulant. Une fois que vous avez sélectionné un jeu de données, indiquez un nom et une description pour votre flux de données.

existing-dataset

Utiliser un nouveau jeu de données

Pour procéder à lʼingestion dans un nouveau jeu de données, sélectionnez Nouveau jeu de données, puis saisissez un nom pour le jeu de données de sortie et une description facultative. Sélectionnez ensuite un schéma à mapper à l’aide de l’option Recherche avancée ou en faisant défiler la liste des schémas existants dans le menu déroulant. Une fois que vous avez sélectionné un schéma, saisissez un nom et une description pour votre flux de données.

new-dataset

Activer Profile et les diagnostics d’erreur

Sélectionnez ensuite le bouton (bascule) du Jeu de données de profil pour activer votre jeu de données pour Profile. Cela vous permet de créer une vue holistique des attributs et des comportements d’une entité. Les données issues de tous les jeux de données activés par le Profile seront incluses dans Profile et les modifications sont appliquées lorsque vous enregistrez votre flux de données.

Le diagnostic d’erreur permet de générer un message d’erreur détaillé pour tout enregistrement erroné survenant dans votre flux de données, tandis que l’ingestion partielle vous permet d’ingérer des données contenant des erreurs, jusqu’à un certain seuil que vous définissez manuellement. Pour plus d’informations, consultez la présentation de l’ingestion par lots partiels.

profile-and-errors

Activer les alertes

Vous pouvez activer les alertes pour recevoir des notifications sur le statut de votre flux de données. Sélectionnez une alerte dans la liste et abonnez-vous à des notifications concernant le statut de votre flux de données. Pour plus d’informations sur les alertes, consultez le guide sur l’abonnement aux alertes des sources dans l’interface utilisateur.

Lorsque vous avez terminé de renseigner votre flux de données, sélectionnez Suivant.

alertes

Mappage des champs de données à un schéma XDM

IMPORTANT
Vous ne pouvez pas mapper des valeurs de paires de clés dynamiques en tant qu’objet à partir de OneTrust à Platform et doivent spécifier ces clés dans le schéma cible pour mapper vos données lors de l’ingestion.

L’interface de mappage fournit un outil complet pour mapper les champs sources de votre schéma source aux champs XDM cibles correspondants dans le schéma cible.

Platform fournit des recommandations intelligentes pour les champs mappés automatiquement en fonction du schéma ou du jeu de données cible que vous avez sélectionné. Vous pouvez ajuster manuellement les règles de mappage en fonction de vos cas d’utilisation. Selon vos besoins, vous pouvez choisir de mapper directement des champs ou d’utiliser des fonctions de préparation de données pour transformer les données sources afin d’obtenir des valeurs informatisées ou calculées. Pour obtenir des instructions complètes sur l’utilisation de l’interface du mappeur et des champs calculés, voir la section Guide de l’interface utilisateur de la préparation de données.

Une fois le mappage de vos données source réussi, sélectionnez Suivant.

mappage

Planification des exécutions d’ingestion

La variable Planification s’affiche, ce qui vous permet de configurer un planning d’ingestion pour ingérer automatiquement les données source sélectionnées à l’aide des mappages configurés. Par défaut, la planification est définie sur Once. Pour régler la fréquence d’ingestion, sélectionnez Fréquence puis sélectionnez une option dans le menu déroulant.

TIP
L’intervalle et le renvoi ne sont pas visibles lors d’une ingestion unique.

scheduling

Si vous définissez votre fréquence d’ingestion sur Minute, Hour, Day, ou Week, vous devez ensuite définir un intervalle pour établir une période définie entre chaque ingestion. Par exemple, une fréquence d’ingestion définie sur Day et un intervalle défini sur 15 signifie que votre flux de données est planifié pour ingérer des données tous les 15 jours.

Au cours de cette étape, vous pouvez également activer renvoyer et définissez une colonne pour l’ingestion incrémentielle des données. Le renvoi est utilisé pour ingérer des données historiques, tandis que la colonne que vous définissez pour l’ingestion incrémentielle permet de différencier les nouvelles données des données existantes.

Consultez le tableau ci-dessous pour plus d’informations sur les configurations de planification.

Champ
Description
Fréquence
Fréquence d’ingestion. Les fréquences sélectionnées incluent Once, Minute, Hour, Day, et Week.
Intervalle
Entier qui définit l’intervalle pour la fréquence sélectionnée. La valeur de l’intervalle doit être un entier non nul et doit être définie sur supérieur ou égal à 15.
Heure de début
Horodatage UTC indiquant quand la toute première ingestion est configurée pour se produire. L’heure de début doit être supérieure ou égale à l’heure UTC actuelle.
Renvoi
Valeur boolean qui détermine les données ingérées initialement. Si le renvoi est activé, tous les fichiers actuels du chemin spécifié seront ingérés lors de la première ingestion planifiée. Si le renvoi est désactivé, seuls les fichiers chargés entre la première exécution de l’ingestion et l’heure de début seront ingérés. Les fichiers chargés avant l’heure de début ne seront pas ingérés.
Chargement des données incrémentielles par
Une option avec un ensemble filtré de champs de schéma source de type, date ou heure. Le champ que vous sélectionnez Chargement des données incrémentielles par doit avoir ses valeurs de date et heure dans le fuseau horaire UTC pour charger correctement les données incrémentielles. Toutes les sources par lots basées sur un tableau sélectionnent des données incrémentielles en comparant une valeur d’horodatage de colonne delta à l’heure UTC de la fenêtre d’exécution de flux correspondante, puis en copiant les données de la source, si de nouvelles données sont trouvées dans la fenêtre d’heure UTC.

renvoyer

Vérifier le flux de données

L’écran de Révision s’affiche, vous permettant dʼexaminer votre nouveau flux de données avant sa création. Les détails sont regroupés dans les catégories suivantes :

  • Connexion  : affiche le type de source, le chemin d’accès correspondant au fichier source choisi et le nombre de colonnes au sein de ce fichier source.
  • Attribuer des champs de jeu de données et de mappage  : affiche le jeu de données dans lequel les données sources sont ingérées, y compris le schéma auquel le jeu de données se conforme.
  • Planification: indique la période, la fréquence et l’intervalle actifs du planning d’ingestion.

Une fois que vous avez vérifié votre flux de données, sélectionnez Terminer et patientez quelques instants le temps que le flux de données soit créé.

review

Surveiller votre flux de données

Une fois votre flux de données créé, vous pouvez surveiller les données ingérées et afficher les informations relatives au taux d’ingestion, aux succès et aux erreurs. Pour plus d’informations sur la surveillance du flux de données, consultez le tutoriel sur surveillance des comptes et des flux de données dans l’interface utilisateur.

Supprimer le flux de données

Vous pouvez supprimer les flux de données qui ne sont plus nécessaires ou qui ont été créés de manière incorrecte à l’aide de la fonction Supprimer, disponible dans l’espace de travail Flux de données. Pour plus d’informations sur la suppression des flux de données, consultez le tutoriel sur la suppression de flux de données dans l’interface utilisateur.

Étapes suivantes

En suivant ce tutoriel, vous avez créé un flux de données pour importer les données de votre source d’analyse vers Platform. Les données entrantes peuvent désormais être utilisées par les services Platform en aval tels que Real-Time Customer Profile et Data Science Workspace. Consultez les documents suivants pour plus d’informations :

WARNING
L’interface utilisateur de Platform affichée dans la vidéo suivante est obsolète. Consultez la documentation pour découvrir les dernières captures dʼécran et fonctionnalités de lʼinterface utilisateur.
recommendation-more-help
337b99bb-92fb-42ae-b6b7-c7042161d089