Diffusion en continu des données de votre base de données Snowflake vers l’Experience Platform à l’aide de l’interface utilisateur
Découvrez comment utiliser l’interface utilisateur pour diffuser des données de votre base de données Snowflake vers Adobe Experience Platform en suivant ce guide.
Commencer
Ce tutoriel nécessite une compréhension du fonctionnement des composants suivants d’Adobe Experience Platform :
-
Experience Data Model (XDM) Système : le cadre normalisé en fonction duquel Experience Platform organise les données d’expérience client.
- Principes de base de la composition des schémas : découvrez les blocs de création de base des schémas XDM, y compris les principes clés et les bonnes pratiques en matière de composition de schémas.
- Tutoriel sur l’éditeur de schémas : découvrez comment créer des schémas personnalisés à l’aide de l’interface utilisateur de l’éditeur de schémas.
-
Real-Time Customer Profile : fournit un profil de consommateur unifié en temps réel, basé sur des données agrégées provenant de plusieurs sources.
Authentification
Pour plus d’informations sur les étapes à suivre avant d’ingérer des données en continu de Snowflake vers l’Experience Platform, consultez le guide sur la configuration prérequise pour la Snowflake diffusion en continu .
Utilisez la source Snowflake Streaming pour diffuser des données Snowflake vers l’Experience Platform
Dans l’interface utilisateur de Platform, sélectionnez Sources dans le volet de navigation de gauche pour accéder à l’espace de travail Sources. Vous pouvez sélectionner la catégorie appropriée dans le catalogue sur le côté gauche de votre écran. Vous pouvez également trouver la source spécifique à utiliser à l’aide de l’option de recherche.
Sous la catégorie Bases de données, sélectionnez Snowflake Streaming, puis Ajouter des données.
La page Se connecter au compte de diffusion en continu de Snowflake s’affiche. Sur cette page, vous pouvez utiliser des informations d’identification nouvelles ou existantes.
Pour créer un compte, sélectionnez Nouveau compte et fournissez un nom, une description facultative et vos informations d’identification.
Lorsque vous avez terminé, sélectionnez Se connecter à la source puis attendez que la nouvelle connexion s’établisse.
table 0-row-2 1-row-2 2-row-2 3-row-2 4-row-2 5-row-2 6-row-2 7-row-2 | |
---|---|
Informations d’identification | Description |
Compte | Nom de votre compte Snowflake. Pour les conventions sur les noms de compte, lisez le Snowflake Streaming guide d'authentification. |
Entrepôt | Nom de votre entrepôt Snowflake. Les entrepôts gèrent l’exécution des requêtes dans Snowflake. Chaque entrepôt Snowflake est indépendant l’un de l’autre et doit être accessible individuellement pour importer des données dans Experience Platform. |
Base de données | Nom de la base de données Snowflake. La base de données contient les données que vous souhaitez importer dans Experience Platform. |
Schéma | (Facultatif) Le schéma de base de données associé à votre compte Snowflake. |
Nom d’utilisateur | Nom d’utilisateur de votre compte Snowflake. |
Mot de passe | Mot de passe de votre compte Snowflake. |
Rôle | (Facultatif) Rôle personnalisé pouvant être fourni à un utilisateur pour une connexion donnée. Si elle n’est pas fournie, cette valeur est définie par défaut sur public . |
Pour plus d’informations sur la création de compte, consultez la section sur la configuration des paramètres de rôle dans la présentation de Snowflake Streaming.
Pour utiliser un compte existant, sélectionnez Compte existant , puis le compte de votre choix dans le catalogue de comptes existant.
Cliquez sur Suivant pour continuer.
Sélectionner les données select-data
-
Une colonne d’horodatage doit exister dans votre table source pour qu’un flux de données en continu soit créé. L’horodatage est requis pour que l’Experience Platform sache quand les données seront ingérées et quand les données incrémentielles seront diffusées. Vous pouvez ajouter rétroactivement une colonne d’horodatage pour une connexion existante et créer un nouveau flux de données.
-
Assurez-vous que la casse des champs de données de votre fichier de données source d’exemple est conforme aux instructions de Snowflake sur la résolution de la casse pour les identifiants. Pour plus d’informations, consultez le Snowflake document sur la casse de l’identifiant .
L’étape Sélectionner des données apparaît. Au cours de cette étape, vous devez sélectionner les données à importer dans Experience Platform, configurer les horodatages et les fuseaux horaires, puis fournir un exemple de fichier de données source pour l’ingestion de données brutes.
Utilisez le répertoire de la base de données situé à gauche de l'écran et sélectionnez la table à importer dans Experience Platform.
Sélectionnez ensuite le type de colonne d’horodatage de votre tableau. Vous pouvez choisir entre deux types de colonnes d’horodatage : TIMESTAMP_NTZ
ou TIMESTAMP_LTZ
. Si vous sélectionnez un type de colonne TIMESTAMP_NTZ
, vous devez également fournir un fuseau horaire. Vos colonnes doivent avoir une contrainte non nulle. Pour plus d'informations, consultez la section sur les [limitations et les questions fréquentes]
Vous pouvez également configurer les paramètres de renvoi au cours de cette étape. Le renvoi détermine les données ingérées initialement. Si le renvoi est activé, tous les fichiers actuels du chemin spécifié seront ingérés lors de la première ingestion planifiée. Dans le cas contraire, seuls les fichiers chargés entre la première exécution de l’ingestion et l’heure de début seront ingérés. Les fichiers chargés avant l’heure de début ne seront pas ingérés.
Sélectionnez le bouton d’activation/désactivation Renvoi pour activer le renvoi.
Enfin, sélectionnez Choisir le fichier pour charger un exemple de données source afin de créer le jeu de mappages, qui sera utilisé ultérieurement pour mapper vos données d’origine au modèle de données d’expérience (XDM).
Lorsque vous avez terminé, sélectionnez Suivant pour continuer.
Fournir des détails sur les jeux de données et les flux de données provide-dataset-and-dataflow-details
Ensuite, vous devez fournir des informations sur votre jeu de données et votre flux de données.
Détails du jeu de données dataset-details
Un jeu de données est une structure de stockage et de gestion pour une collection de données, généralement sous la forme d’un tableau, qui contient un schéma (des colonnes) et des champs (des lignes). Les données correctement ingérées dans Experience Platform sont conservées en tant que jeux de données dans le lac de données. Au cours de cette étape, vous pouvez créer un nouveau jeu de données ou utiliser un jeu de données existant.
Pour utiliser un nouveau jeu de données, sélectionnez Nouveau jeu de données, puis fournissez un nom et une description facultative de votre jeu de données. Vous devez également sélectionner un schéma de modèle de données d’expérience (XDM) auquel votre jeu de données adhère.
table 0-row-2 1-row-2 2-row-2 3-row-2 | |
---|---|
Détails du nouveau jeu de données | Description |
Nom du jeu de données de sortie | Nom de votre nouveau jeu de données. |
Description | (Facultatif) Aperçu rapide du nouveau jeu de données. |
Schéma | Liste déroulante des schémas qui existent dans votre organisation. Vous pouvez également créer votre propre schéma avant le processus de configuration de la source. Pour plus d’informations, consultez le guide sur la création d’un schéma XDM dans l’interface utilisateur. |
Si vous disposez déjà d’un jeu de données existant, sélectionnez Jeu de données existant, puis utilisez l’option Recherche avancée pour afficher une fenêtre de tous les jeux de données de votre organisation, y compris leurs détails respectifs, comme s’ils sont activés pour l’ingestion dans Real-Time Customer Profile.
Si votre jeu de données est activé pour Real-time Customer Profile, vous pouvez, au cours de cette étape, activer le jeu de données Profile pour activer vos données pour l’ingestion par profil. Vous pouvez également utiliser cette étape pour activer les {diagnostics d’erreur et l’ ingestion partielle.
- Diagnostic d’erreur : sélectionnez Diagnostic d’erreur pour demander à la source de produire des diagnostics d’erreur que vous pourrez ensuite référencer lors de la surveillance de l’activité de votre jeu de données et de l’état du flux de données.
- Ingestion partielle : l’ingestion par lots partielle permet d’ingérer des données contenant des erreurs, jusqu’à un certain seuil configurable. Cette fonctionnalité vous permet d’ingérer toutes vos données précises dans Experience Platform, tandis que toutes vos données incorrectes sont traitées par lots séparément avec des informations sur les raisons de leur non-validité.
Détails du flux de données dataflow-details
Une fois votre jeu de données configuré, vous devez fournir des détails sur votre flux de données, y compris un nom, une description facultative et des configurations d’alerte.
Experience Platform peut produire des alertes basées sur des événements auxquelles les utilisateurs peuvent s’abonner. Ces options nécessitent un flux de données en cours d’exécution pour les déclencher. Pour plus d’informations, consultez la présentation des alertes
- Démarrage de l’exécution du flux de données des sources : sélectionnez cette alerte pour recevoir une notification lorsque l’exécution du flux de données démarre.
- L’exécution du flux de données Sources réussit : sélectionnez cette alerte pour recevoir une notification si votre flux de données se termine sans erreur.
- Sources Échec de l’exécution du flux de données : sélectionnez cette alerte pour recevoir une notification si l’exécution du flux de données se termine par des erreurs.
Lorsque vous avez terminé, sélectionnez Suivant pour continuer.
Mappage de champs à un schéma XDM mapping
L’étape Mappage apparaît. Utilisez l’interface de mappage pour mapper vos données source aux champs de schéma appropriés avant d’ingérer ces données dans Experience Platform, puis sélectionnez Suivant. Pour obtenir un guide complet sur l’utilisation de l’interface de mappage, consultez le guide de l’interface utilisateur de la préparation des données pour plus d’informations.
Vérifier le flux de données review
La dernière étape du processus de création de flux de données consiste à passer en revue votre flux de données avant de l’exécuter. Utilisez l’étape Réviser pour passer en revue les détails de votre nouveau flux de données avant de s’exécuter. Les détails sont regroupés dans les catégories suivantes :
- Connexion : indique le type de source, le chemin d’accès approprié du fichier source sélectionné et le nombre de colonnes dans ce fichier source.
- Attribuer des champs de jeu de données et de mappage : affiche le jeu de données dans lequel les données sources sont ingérées, y compris le schéma auquel le jeu de données se conforme.
Une fois que vous avez vérifié votre flux de données, sélectionnez Terminer et patientez quelques instants le temps que le flux de données soit créé.
Étapes suivantes
En suivant ce tutoriel, vous avez créé un flux de données en continu pour les données Snowflake. Pour obtenir des ressources supplémentaires, consultez la documentation ci-dessous.
Surveiller votre flux de données
Une fois votre flux de données créé, vous pouvez surveiller les données qui sont ingérées par celui-ci pour afficher des informations sur les taux d’ingestion, la réussite et les erreurs. Pour plus d’informations sur la manière de surveiller les flux de données en continu, consultez le tutoriel sur la surveillance des flux de données en continu dans l’interface utilisateur.
Mettre à jour votre flux de données
Pour mettre à jour les configurations de la planification, du mappage et des informations générales de vos flux de données, consultez le tutoriel sur la mise à jour des flux de données de sources dans l’interface utilisateur.
Supprimer le flux de données
Vous pouvez supprimer les flux de données qui ne sont plus nécessaires ou qui ont été créés de manière incorrecte à l’aide de la fonction Supprimer, disponible dans l’espace de travail Flux de données. Pour plus d’informations sur la suppression des flux de données, consultez le tutoriel sur la suppression des flux de données dans l’interface utilisateur.