Adobe Experience Platform permet d’ingérer des données à partir de sources externes tout en vous offrant la possibilité de structurer, d’étiqueter et d’améliorer les données entrantes à l’aide des services de Platform. Vous pouvez ingérer des données provenant de diverses sources telles que les applications Adobe, le stockage dans le cloud, les bases de données, etc.
Experience Platform prend en charge la diffusion en continu de données depuis un Snowflake base de données.
La variable Snowflake la source de diffusion en continu fonctionne en chargeant des données en exécutant régulièrement une requête SQL et en créant un enregistrement de sortie pour chaque ligne de l’ensemble obtenu.
En utilisant Kafka Connect, la variable Snowflake source de diffusion continue effectue le suivi des derniers enregistrements qu’elle reçoit de chaque table, de sorte qu’elle puisse commencer à l’emplacement approprié pour la prochaine itération. La source utilise cette fonctionnalité pour filtrer les données et obtenir uniquement les lignes mises à jour d’un tableau à chaque itération.
La section suivante décrit les étapes préalables requises à suivre pour que vous puissiez diffuser des données à partir de votre Snowflake base de données vers Experience Platform :
Pour Flow Service pour vous connecter à Snowflake, vous devez fournir les propriétés de connexion suivantes :
Informations d’identification | Description |
---|---|
account |
Le nom complet du compte associé à votre Snowflake compte . Une personne entièrement qualifiée Snowflake nom du compte inclut le nom de votre compte, votre région et votre plateforme cloud. Par exemple : cj12345.east-us-2.azure . Pour plus d'informations sur les noms de compte, reportez-vous à cette section [Snowflake document on account identifiers] (https://docs.snowflake.com/en/user-guide/admin-account-identifier.html). |
warehouse |
La variable Snowflake l’entrepôt gère le processus d’exécution des requêtes de l’application. Chaque Snowflake L’entrepôt est indépendant l’un de l’autre et doit être accessible individuellement lors de l’importation de données vers Platform. |
database |
La variable Snowflake La base de données contient les données que vous souhaitez importer dans Platform. |
username |
Nom d’utilisateur de la variable Snowflake compte . |
password |
Le mot de passe du Snowflake compte utilisateur. |
role |
(Facultatif) Rôle personnalisé pouvant être fourni à un utilisateur, pour une connexion donnée. Si elle n’est pas fournie, cette valeur est définie par défaut sur public . |
connectionSpec.id |
La spécification de connexion renvoie les propriétés du connecteur d’une source, y compris les spécifications d’authentification liées à la création des connexions de base et source. L’identifiant de spécification de connexion pour Snowflake is 51ae16c2-bdad-42fd-9fce-8d5dfddaf140 . |
Pour plus d'informations sur l'authentification, reportez-vous à cette section [Snowflake document] (https://docs.snowflake.com/en/user-guide/key-pair-auth.html).
Vous devez configurer des privilèges sur un rôle, même si le rôle public par défaut est attribué, pour permettre à votre connexion source d’accéder aux Snowflake base de données, schéma et tableau. Les différents privilèges pour différents Snowflake entities se présente comme suit :
Snowflake entity | Privilège du rôle Require |
---|---|
Entrepôt | OPÉRATION, UTILISATION |
Base de données | UTILISATION |
Schéma | UTILISATION |
Tableau | SELECT |
La reprise automatique et la suspension automatique doivent être activées dans la configuration avancée de votre entrepôt.
Pour plus d’informations sur la gestion des rôles et des privilèges, voir [Snowflake Référence d’API] (https://docs.snowflake.com/en/sql-reference/sql/grant-privilege).
backfill
indicateur booléen pour votre Snowflake source lors de la création d’une connexion source.
TIMESTAMP_LTZ
ou TIMESTAMP_NTZ
. Si la colonne d’horodatage est définie sur TIMESTAMP_NTZ
, le fuseau horaire correspondant dans lequel les valeurs sont stockées doit être transmis via la variable timezoneValue
. Si elle n’est pas fournie, la valeur est définie par défaut sur UTC.
TIMESTAMP_TZ
ne peut pas être utilisé dans une colonne d’horodatage ou dans un mappage.Le tutoriel suivant décrit les étapes à suivre pour connecter votre Snowflake source de diffusion en continu vers l’Experience Platform à l’aide de l’API :