Configuration d’un flux de données pour une connexion par lots à un enregistrement cloud dans l’interface utilisateur

Un flux de données est une tâche planifiée qui récupère et ingère des données d'une source dans un jeu de données Platform. Ce didacticiel décrit la procédure à suivre pour configurer un nouveau flux de données à l’aide de votre compte d’enregistrement cloud.

Prise en main

Ce tutoriel nécessite une compréhension du fonctionnement des composants suivants d’Adobe Experience Platform :

  • Experience Data Model (XDM) Système : Cadre normalisé selon lequel Experience Platform organiser les données d’expérience client.
    • Principes de base de la composition des schémas : découvrez les blocs de création de base des schémas XDM, y compris les principes clés et les bonnes pratiques en matière de composition de schémas.
    • Didacticiel sur l’éditeur de schéma : Découvrez comment créer des schémas personnalisés à l’aide de l’interface utilisateur de l’éditeur de Schémas.
  • Real-time Customer Profile : fournit un profil client en temps réel unifié basé sur des données agrégées issues de plusieurs sources.

De plus, ce didacticiel nécessite que vous disposiez d’un compte d’enregistrement cloud établi. Vous trouverez une liste de didacticiels pour la création de différents comptes d’enregistrement Cloud dans l’interface utilisateur dans la section présentation des connecteurs source.

Formats de fichiers pris en charge

Experience Platform prend en charge les formats de fichier suivants à ingérer à partir d’enregistrements externes :

  • Valeurs séparées par des délimiteurs (DSV) : Toute valeur à caractère unique peut être utilisée comme délimiteur pour les fichiers de données au format DSV.
  • JavaScript Object Notation (JSON) : Les fichiers de données au format JSON doivent être compatibles XDM.
  • Apache Parquet: Les fichiers de données au format Parquet doivent être compatibles XDM.

Sélectionner des données

Après avoir créé votre compte d’enregistrement cloud, l’étape Sélectionner les données s’affiche, ce qui vous permet d’explorer la hiérarchie des fichiers d’enregistrement cloud.

  • La partie gauche de l’interface est un navigateur d’annuaire qui affiche vos fichiers et répertoires d’enregistrement cloud.
  • La partie droite de l'interface vous permet de prévisualisation jusqu'à 100 lignes de données à partir d'un fichier compatible.

interface

La sélection d’un dossier répertorié vous permet de parcourir la hiérarchie de dossiers en dossiers plus profonds. Vous pouvez sélectionner un seul dossier pour ingérer tous les fichiers de manière récursive dans le dossier. Lors de l’importation d’un dossier entier, vous devez vous assurer que tous les fichiers qu’il contient partagent le même schéma.

Une fois que vous avez sélectionné un fichier ou un dossier compatible, sélectionnez le format de données correspondant dans le menu déroulant Sélectionner le format de données.

Le tableau suivant affiche le format de données approprié pour les types de fichiers pris en charge :

Type de fichier Sur le format des données saisies
CSV Délimité
JSON JSON
Parquet Parquet XDM

Sélectionnez JSON et attendez quelques secondes que l’interface de prévisualisation soit renseignée.

select-data

REMARQUE

Contrairement aux types de fichiers délimités et JSON, les fichiers au format Parquet ne sont pas disponibles pour la prévisualisation.

L'interface de prévisualisation vous permet d'examiner le contenu et la structure d'un fichier. Par défaut, l’interface de prévisualisation affiche le premier fichier du dossier sélectionné.

Pour prévisualisation à un autre fichier, sélectionnez l'icône de prévisualisation en regard du nom du fichier à inspecter.

prévisualisation par défaut

Une fois que vous avez examiné le contenu et la structure des fichiers de votre dossier, sélectionnez Suivant pour importer tous les fichiers du dossier de manière récursive.

select-folder

Si vous préférez sélectionner un fichier spécifique, sélectionnez le fichier à importer, puis sélectionnez Suivant.

select-file

Définition d’un délimiteur personnalisé pour les fichiers délimités

Vous pouvez définir un délimiteur personnalisé lors de l’importation de fichiers délimités. Sélectionnez l'option Délimiteur, puis sélectionnez un délimiteur dans le menu déroulant. Le menu affiche les options les plus fréquemment utilisées pour les délimiteurs, notamment une virgule (,), une tabulation (\t) et une barre verticale (|). Si vous préférez utiliser un délimiteur personnalisé, sélectionnez Personnalisé et entrez un délimiteur à un caractère dans la barre d’entrée contextuelle.

Une fois que vous avez sélectionné le format de données et défini votre délimiteur, sélectionnez Suivant.

Mappage des champs de données à un schéma XDM

L’étape Mappage s’affiche, fournissant une interface interactive permettant de mapper les données source à un jeu de données Platform. Les fichiers source formatés dans Parquet doivent être conformes à XDM et ne nécessitent pas de configuration manuelle du mappage, tandis que les fichiers CSV nécessitent de configurer explicitement le mappage, mais vous permettent de sélectionner les champs de données source à mapper. Les fichiers JSON, s’ils sont marqués comme plainte XDM, ne nécessitent pas de configuration manuelle. Cependant, si elle n’est pas marquée comme compatible XDM, vous devrez configurer explicitement le mappage.

Choisissez un jeu de données dans lequel les données entrantes doivent être assimilées. Vous pouvez soit utiliser un jeu de données existant, soit en créer un nouveau.

Utilisation d’un jeu de données existant

Pour importer des données dans un jeu de données existant, sélectionnez Jeu de données existant, puis sélectionnez l'icône Jeu de données.

La boîte de dialogue Sélectionner un jeu de données s'affiche. Recherchez le jeu de données que vous souhaitez utiliser, sélectionnez-le, puis cliquez sur Continuer.

Utiliser un nouveau jeu de données

Pour importer des données dans un nouveau jeu de données, sélectionnez Nouveau jeu de données et saisissez un nom et une description pour le jeu de données dans les champs fournis. Pour ajouter un schéma, vous pouvez entrer un nom de schéma existant dans la boîte de dialogue Sélectionner un schéma. Vous pouvez également sélectionner la recherche avancée Schéma pour rechercher un schéma approprié.

Au cours de cette étape, vous pouvez activer votre jeu de données pour Real-time Customer Profile et créer une vue holistique des attributs et des comportements d'une entité. Les données de tous les jeux de données activés sont incluses dans Profile et des modifications sont appliquées lorsque vous enregistrez votre flux de données.

Cliquez sur le bouton Profil de données pour activer votre jeu de données de cible pour Profile.

La boîte de dialogue Sélectionner le schéma s'affiche. Sélectionnez le schéma à appliquer au nouveau jeu de données, puis sélectionnez Terminé.

Selon vos besoins, vous pouvez choisir de mapper directement les champs ou utiliser les fonctions de mappage pour transformer les données source afin de dériver des valeurs calculées ou calculées. Pour plus d'informations sur les fonctions de mappage et de mappage de données, consultez le didacticiel mappage des données CSV aux champs de schéma XDM.

Pour les fichiers JSON, outre le mappage direct des champs à d’autres champs, vous pouvez directement mapper des objets à d’autres objets et tableaux à d’autres tableaux. Vous pouvez également prévisualisation et mapper des types de données complexes tels que des tableaux dans des fichiers JSON à l’aide d’un connecteur source d’enregistrement de cloud.

Veuillez noter que vous ne pouvez pas mapper sur différents types. Par exemple, vous ne pouvez pas mapper un objet à un tableau ou un champ à un objet.

CONSEIL

Platform fournit des recommandations intelligentes pour les champs à mappage automatique en fonction du schéma de cible ou du jeu de données que vous avez sélectionné. Vous pouvez ajuster manuellement les règles de mappage en fonction de vos cas d’utilisation.

Sélectionnez données de Prévisualisation pour afficher les résultats de mappage de 100 lignes de données d’exemple au maximum du jeu de données sélectionné.

Au cours de la prévisualisation, la colonne d'identité est considérée comme le premier champ, car il s'agit des informations clés nécessaires à la validation des résultats de mappage.

Une fois les données source mises en correspondance, sélectionnez Fermer.

Planifier les exécutions d'assimilation

L'étape Planification s'affiche, ce qui vous permet de configurer une planification d'assimilation pour assimiler automatiquement les données source sélectionnées à l'aide des mappages configurés. Le tableau suivant décrit les différents champs configurables pour la planification :

Champ Description
Fréquence Les fréquences sélectionnées sont Once, Minute, Hour, Day et Week.
Intervalle Entier qui définit l’intervalle pour la fréquence sélectionnée.
Début Horodatage UTC indiquant à quel moment la première importation est prévue.
Renvoi Valeur booléenne qui détermine quelles données sont initialement ingérées. Si Renvoi est activé, tous les fichiers en cours dans le chemin spécifié seront ingérés lors de la première assimilation planifiée. Si Renvoi est désactivé, seuls les fichiers chargés entre la première exécution de l’assimilation et la durée du début seront ingérés. Les fichiers chargés avant l'heure du début ne seront pas ingérés.

Les flux de données sont conçus pour intégrer automatiquement les données sur une base planifiée. Début en sélectionnant la fréquence d'ingestion. Ensuite, définissez l’intervalle pour désigner la période entre deux exécutions de flux. La valeur de l’intervalle doit être un entier non nul et doit être définie sur supérieur ou égal à 15.

Pour définir l’heure de début d’assimilation, ajustez la date et l’heure affichées dans la zone début d’heure. Vous pouvez également sélectionner l’icône de calendrier pour modifier la valeur de début. L'heure du début doit être supérieure ou égale à l'heure actuelle en UTC.

Indiquez les valeurs de la planification et sélectionnez Suivant.

Configuration d’un flux de données d’assimilation unique

Pour configurer l’assimilation unique, sélectionnez la flèche de la liste déroulante de fréquence et sélectionnez Une fois. Vous pouvez continuer à apporter des modifications à un jeu de flux de données pour une assimilation de fréquence unique, tant que le début de temps restera dans le futur. Une fois l’heure du début écoulée, la valeur de fréquence unique ne peut plus être modifiée. ​Intervaland ​Backfillare n’est pas visible lors de la configuration d’un flux de données d’assimilation unique.

IMPORTANT

Il est fortement recommandé de planifier votre flux de données pour une assimilation unique lors de l’utilisation du connecteur FTP.

Une fois que vous avez fourni les valeurs appropriées à la planification, sélectionnez Suivant.

Fournir des détails sur le flux de données

L'étape Détails du flux de données s'affiche, vous permettant de nommer et de décrire brièvement votre nouveau flux de données.

Au cours de ce processus, vous pouvez également activer les diagnostics d'erreur et diagnostic d'erreur. L'activation de l'ingestion partielle permet d'assimiler les données contenant des erreurs, jusqu'à un certain seuil que vous pouvez définir. L'activation de diagnostics d'erreur fournit des détails sur toute donnée incorrecte mise en lot séparément. Pour plus d'informations, consultez l'aperçu de l'assimilation partielle des lots.

Fournissez des valeurs pour le flux de données et sélectionnez Next.

Vérifier votre flux de données

L'étape Réviser s'affiche, vous permettant de vérifier votre nouveau flux de données avant sa création. Les détails sont regroupés dans les catégories suivantes :

  • Connexion : Indique le type de source, le chemin d’accès approprié du fichier source choisi et le nombre de colonnes qu’il contient.
  • Attribuer des champs de jeu de données et de mappage : Affiche le jeu de données dans lequel les données source sont ingérées, y compris le schéma auquel le jeu de données adhère.
  • Planification : Indique la principale période, fréquence et intervalle du calendrier d'assimilation.

Une fois que vous avez passé en revue votre flux de données, cliquez sur Terminer et attendez un certain temps pour que le flux de données soit créé.

Surveiller votre flux de données

Une fois le flux de données créé, vous pouvez surveiller les données ingérées pour afficher des informations sur les taux d'assimilation, la réussite et les erreurs. Pour plus d'informations sur la façon de surveiller le flux de données, consultez le didacticiel surveillance des comptes et flux de données dans l'interface utilisateur.

Supprimer votre flux de données

Vous pouvez supprimer des flux de données qui ne sont plus nécessaires ou qui ont été créés incorrectement à l’aide de la fonction Supprimer disponible dans l’espace de travail Flux de données. Pour plus d'informations sur la façon de supprimer des flux de données, consultez le didacticiel sur la suppression des flux de données dans l'interface utilisateur.

Étapes suivantes

En suivant ce didacticiel, vous avez réussi à créer un flux de données pour importer des données à partir d’un enregistrement cloud externe et à mieux comprendre la surveillance des jeux de données. Pour en savoir plus sur la création de flux de données, vous pouvez compléter votre apprentissage en regardant la vidéo ci-dessous. De plus, les données entrantes peuvent désormais être utilisées par les services Platform en aval tels que Real-time Customer Profile et Data Science Workspace. Pour plus d’informations, voir les documents suivants :

AVERTISSEMENT

L'interface utilisateur Platform affichée dans la vidéo suivante est obsolète. Reportez-vous à la documentation ci-dessus pour obtenir les dernières captures d'écran et fonctionnalités de l'interface utilisateur.

Annexe

Les sections suivantes fournissent des informations supplémentaires sur l’utilisation des connecteurs source.

Désactivation d’un flux de données

Lorsqu’un flux de données est créé, il devient immédiatement principal et ingère les données selon le planning qu’il a reçu. Vous pouvez désactiver un flux de données principal à tout moment en suivant les instructions ci-dessous.

Dans l'espace de travail Sources, cliquez sur l'onglet Parcourir. Cliquez ensuite sur le nom du compte associé au flux de données principal que vous souhaitez désactiver.

La page activité source s'affiche. Sélectionnez le flux de données principal dans la liste pour ouvrir sa colonne Propriétés sur le côté droit de l'écran, qui contient un bouton d'activation Activé. Cliquez sur la bascule pour désactiver le flux de données. La même bascule peut être utilisée pour réactiver un flux de données après sa désactivation.

Activer les données entrantes pour la population Profile

Les données entrantes de votre connecteur source peuvent être utilisées pour enrichir et renseigner vos données Real-time Customer Profile. Pour plus d'informations sur le renseignement de vos données Real-time Customer Profile, consultez le tutoriel sur population de Profils.

Sur cette page

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now