Diffusion en continu des données de votre base de données Snowflake vers l’Experience Platform à l’aide de l’interface utilisateur

Découvrez comment utiliser l’interface utilisateur pour diffuser des données de votre base de données Snowflake vers Adobe Experience Platform en suivant ce guide.

Commencer

Ce tutoriel nécessite une compréhension du fonctionnement des composants suivants d’Adobe Experience Platform :

Authentification

Pour plus d’informations sur les étapes à suivre avant d’ingérer des données en continu de Snowflake vers l’Experience Platform, consultez le guide sur la configuration prérequise pour la Snowflake diffusion en continu .

Utilisez la source Snowflake Streaming pour diffuser des données Snowflake vers l’Experience Platform

Dans l’interface utilisateur de Platform, sélectionnez Sources dans le volet de navigation de gauche pour accéder à l’espace de travail Sources. Vous pouvez sélectionner la catégorie appropriée dans le catalogue sur le côté gauche de votre écran. Vous pouvez également trouver la source spécifique à utiliser à l’aide de l’option de recherche.

Sous la catégorie Bases de données, sélectionnez Snowflake Streaming, puis Ajouter des données.

TIP
Les sources qui n’ont pas de compte authentifié dans le catalogue de sources affichent l’option Configurer . Une fois qu’il existe un compte authentifié, cette option devient Ajouter des données.

Catalogue de sources dans l’interface utilisateur Experience Platform, avec la carte source de diffusion en continu Snowflake sélectionnée.

La page Se connecter au compte de diffusion en continu de Snowflake s’affiche. Sur cette page, vous pouvez utiliser des informations d’identification nouvelles ou existantes.

Créer un compte

Pour créer un compte, sélectionnez Nouveau compte et fournissez un nom, une description facultative et vos informations d’identification.

Lorsque vous avez terminé, sélectionnez Se connecter à la source puis attendez que la nouvelle connexion s’établisse.

Nouvelle interface de création de compte du workflow des sources.

table 0-row-2 1-row-2 2-row-2 3-row-2 4-row-2 5-row-2 6-row-2 7-row-2
Informations d’identification Description
Compte Nom de votre compte Snowflake. Pour les conventions sur les noms de compte, lisez le Snowflake Streaming guide d'authentification.
Entrepôt Nom de votre entrepôt Snowflake. Les entrepôts gèrent l’exécution des requêtes dans Snowflake. Chaque entrepôt Snowflake est indépendant l’un de l’autre et doit être accessible individuellement pour importer des données dans Experience Platform.
Base de données Nom de la base de données Snowflake. La base de données contient les données que vous souhaitez importer dans Experience Platform.
Schéma (Facultatif) Le schéma de base de données associé à votre compte Snowflake.
Nom d’utilisateur Nom d’utilisateur de votre compte Snowflake.
Mot de passe Mot de passe de votre compte Snowflake.
Rôle (Facultatif) Rôle personnalisé pouvant être fourni à un utilisateur pour une connexion donnée. Si elle n’est pas fournie, cette valeur est définie par défaut sur public.

Pour plus d’informations sur la création de compte, consultez la section sur la configuration des paramètres de rôle dans la présentation de Snowflake Streaming.

Utiliser un compte existant

Pour utiliser un compte existant, sélectionnez Compte existant , puis le compte de votre choix dans le catalogue de comptes existant.

Cliquez sur Suivant pour continuer.

Page de sélection de compte existante du catalogue des sources.

Sélectionner les données select-data

IMPORTANT
  • Une colonne d’horodatage doit exister dans votre table source pour qu’un flux de données en continu soit créé. L’horodatage est requis pour que l’Experience Platform sache quand les données seront ingérées et quand les données incrémentielles seront diffusées. Vous pouvez ajouter rétroactivement une colonne d’horodatage pour une connexion existante et créer un nouveau flux de données.

  • Assurez-vous que la casse des champs de données de votre fichier de données source d’exemple est conforme aux instructions de Snowflake sur la résolution de la casse pour les identifiants. Pour plus d’informations, consultez le Snowflake document sur la casse de l’identifiant .

L’étape Sélectionner des données apparaît. Au cours de cette étape, vous devez sélectionner les données à importer dans Experience Platform, configurer les horodatages et les fuseaux horaires, puis fournir un exemple de fichier de données source pour l’ingestion de données brutes.

Utilisez le répertoire de la base de données situé à gauche de l'écran et sélectionnez la table à importer dans Experience Platform.

Linterface de sélection des données avec une table de base de données sélectionnée.

Sélectionnez ensuite le type de colonne d’horodatage de votre tableau. Vous pouvez choisir entre deux types de colonnes d’horodatage : TIMESTAMP_NTZ ou TIMESTAMP_LTZ. Si vous sélectionnez un type de colonne TIMESTAMP_NTZ, vous devez également fournir un fuseau horaire. Vos colonnes doivent avoir une contrainte non nulle. Pour plus d'informations, consultez la section sur les [limitations et les questions fréquentes]

Vous pouvez également configurer les paramètres de renvoi au cours de cette étape. Le renvoi détermine les données ingérées initialement. Si le renvoi est activé, tous les fichiers actuels du chemin spécifié seront ingérés lors de la première ingestion planifiée. Dans le cas contraire, seuls les fichiers chargés entre la première exécution de l’ingestion et l’heure de début seront ingérés. Les fichiers chargés avant l’heure de début ne seront pas ingérés.

Sélectionnez le bouton d’activation/désactivation Renvoi pour activer le renvoi.

Étapes de configuration de l’horodatage, du fuseau horaire et du renvoi.

Enfin, sélectionnez Choisir le fichier pour charger un exemple de données source afin de créer le jeu de mappages, qui sera utilisé ultérieurement pour mapper vos données d’origine au modèle de données d’expérience (XDM).

Lorsque vous avez terminé, sélectionnez Suivant pour continuer.

Aperçu des données d’exemple source.

Fournir des détails sur les jeux de données et les flux de données provide-dataset-and-dataflow-details

Ensuite, vous devez fournir des informations sur votre jeu de données et votre flux de données.

Détails du jeu de données dataset-details

Un jeu de données est une structure de stockage et de gestion pour une collection de données, généralement sous la forme d’un tableau, qui contient un schéma (des colonnes) et des champs (des lignes). Les données correctement ingérées dans Experience Platform sont conservées en tant que jeux de données dans le lac de données. Au cours de cette étape, vous pouvez créer un nouveau jeu de données ou utiliser un jeu de données existant.

Utiliser un nouveau jeu de données

Pour utiliser un nouveau jeu de données, sélectionnez Nouveau jeu de données, puis fournissez un nom et une description facultative de votre jeu de données. Vous devez également sélectionner un schéma de modèle de données d’expérience (XDM) auquel votre jeu de données adhère.

Nouvelle interface de sélection de jeux de données.

table 0-row-2 1-row-2 2-row-2 3-row-2
Détails du nouveau jeu de données Description
Nom du jeu de données de sortie Nom de votre nouveau jeu de données.
Description (Facultatif) Aperçu rapide du nouveau jeu de données.
Schéma Liste déroulante des schémas qui existent dans votre organisation. Vous pouvez également créer votre propre schéma avant le processus de configuration de la source. Pour plus d’informations, consultez le guide sur la création d’un schéma XDM dans l’interface utilisateur.
Utiliser un jeu de données existant

Si vous disposez déjà d’un jeu de données existant, sélectionnez Jeu de données existant, puis utilisez l’option Recherche avancée pour afficher une fenêtre de tous les jeux de données de votre organisation, y compris leurs détails respectifs, comme s’ils sont activés pour l’ingestion dans Real-Time Customer Profile.

Interface de sélection de jeu de données existante.

Sélectionnez les étapes à suivre pour activer l’ingestion du profil, les diagnostics d’erreur et l’ingestion partielle.

Si votre jeu de données est activé pour Real-time Customer Profile, vous pouvez, au cours de cette étape, activer le jeu de données Profile pour activer vos données pour l’ingestion par profil. Vous pouvez également utiliser cette étape pour activer les {diagnostics d’erreur et l’ ingestion partielle.

  • Diagnostic d’erreur : sélectionnez Diagnostic d’erreur pour demander à la source de produire des diagnostics d’erreur que vous pourrez ensuite référencer lors de la surveillance de l’activité de votre jeu de données et de l’état du flux de données.
  • Ingestion partielle : l’ingestion par lots partielle permet d’ingérer des données contenant des erreurs, jusqu’à un certain seuil configurable. Cette fonctionnalité vous permet d’ingérer toutes vos données précises dans Experience Platform, tandis que toutes vos données incorrectes sont traitées par lots séparément avec des informations sur les raisons de leur non-validité.

Détails du flux de données dataflow-details

Une fois votre jeu de données configuré, vous devez fournir des détails sur votre flux de données, y compris un nom, une description facultative et des configurations d’alerte.

L’étape de configuration des détails du flux de données.

Configurations de flux de données
Description
Nom du flux de données
Nom du flux de données. Par défaut, le nom du fichier importé sera utilisé.
Description
(Facultatif) Une brève description de votre flux de données.
Alertes

Experience Platform peut produire des alertes basées sur des événements auxquelles les utilisateurs peuvent s’abonner. Ces options nécessitent un flux de données en cours d’exécution pour les déclencher. Pour plus d’informations, consultez la présentation des alertes

  • Démarrage de l’exécution du flux de données des sources : sélectionnez cette alerte pour recevoir une notification lorsque l’exécution du flux de données démarre.
  • L’exécution du flux de données Sources réussit : sélectionnez cette alerte pour recevoir une notification si votre flux de données se termine sans erreur.
  • Sources Échec de l’exécution du flux de données : sélectionnez cette alerte pour recevoir une notification si l’exécution du flux de données se termine par des erreurs.

Lorsque vous avez terminé, sélectionnez Suivant pour continuer.

Mappage de champs à un schéma XDM mapping

L’étape Mappage apparaît. Utilisez l’interface de mappage pour mapper vos données source aux champs de schéma appropriés avant d’ingérer ces données dans Experience Platform, puis sélectionnez Suivant. Pour obtenir un guide complet sur l’utilisation de l’interface de mappage, consultez le guide de l’interface utilisateur de la préparation des données pour plus d’informations.

Interface de mappage du workflow des sources.

Vérifier le flux de données review

La dernière étape du processus de création de flux de données consiste à passer en revue votre flux de données avant de l’exécuter. Utilisez l’étape Réviser pour passer en revue les détails de votre nouveau flux de données avant de s’exécuter. Les détails sont regroupés dans les catégories suivantes :

  • Connexion : indique le type de source, le chemin d’accès approprié du fichier source sélectionné et le nombre de colonnes dans ce fichier source.
  • Attribuer des champs de jeu de données et de mappage  : affiche le jeu de données dans lequel les données sources sont ingérées, y compris le schéma auquel le jeu de données se conforme.

Une fois que vous avez vérifié votre flux de données, sélectionnez Terminer et patientez quelques instants le temps que le flux de données soit créé.

L’étape de révision du workflow des sources.

Étapes suivantes

En suivant ce tutoriel, vous avez créé un flux de données en continu pour les données Snowflake. Pour obtenir des ressources supplémentaires, consultez la documentation ci-dessous.

Surveiller votre flux de données

Une fois votre flux de données créé, vous pouvez surveiller les données qui sont ingérées par celui-ci pour afficher des informations sur les taux d’ingestion, la réussite et les erreurs. Pour plus d’informations sur la manière de surveiller les flux de données en continu, consultez le tutoriel sur la surveillance des flux de données en continu dans l’interface utilisateur.

Mettre à jour votre flux de données

Pour mettre à jour les configurations de la planification, du mappage et des informations générales de vos flux de données, consultez le tutoriel sur la mise à jour des flux de données de sources dans l’interface utilisateur.

Supprimer le flux de données

Vous pouvez supprimer les flux de données qui ne sont plus nécessaires ou qui ont été créés de manière incorrecte à l’aide de la fonction Supprimer, disponible dans l’espace de travail Flux de données. Pour plus d’informations sur la suppression des flux de données, consultez le tutoriel sur la suppression des flux de données dans l’interface utilisateur.

recommendation-more-help
337b99bb-92fb-42ae-b6b7-c7042161d089