[Version Beta]{class="badge informative"} [Ultimate]{class="badge positive"}
Snowflake source de diffusion
- La variable Snowflake source en continu est en version bêta. Veuillez lire la Présentation des sources pour plus d’informations sur l’utilisation de sources étiquetées bêta.
- La variable Snowflake La source de diffusion en continu est disponible dans l’API pour les utilisateurs qui ont acheté Real-time Customer Data Platform Ultimate.
Adobe Experience Platform permet d’ingérer des données à partir de sources externes tout en vous offrant la possibilité de structurer, d’étiqueter et d’améliorer les données entrantes à l’aide des services de Platform. Vous pouvez ingérer des données provenant de diverses sources telles que les applications Adobe, le stockage dans le cloud, les bases de données, etc.
Experience Platform prend en charge la diffusion en continu de données depuis un Snowflake base de données.
Présentation de la fonction Snowflake source de diffusion
La variable Snowflake la source de diffusion en continu fonctionne en chargeant des données en exécutant régulièrement une requête SQL et en créant un enregistrement de sortie pour chaque ligne de l’ensemble obtenu.
En utilisant Kafka Connect, la variable Snowflake source de diffusion continue effectue le suivi des derniers enregistrements qu’elle reçoit de chaque table, de sorte qu’elle puisse commencer à l’emplacement approprié pour la prochaine itération. La source utilise cette fonctionnalité pour filtrer les données et obtenir uniquement les lignes mises à jour d’un tableau à chaque itération.
Conditions préalables
La section suivante décrit les étapes préalables requises à suivre pour que vous puissiez diffuser des données à partir de votre Snowflake base de données vers Experience Platform :
Collecter les informations d’identification requises
Pour Flow Service pour vous connecter à Snowflake, vous devez fournir les propriétés de connexion suivantes :
account
cj12345.east-us-2.azure
. Pour plus d'informations sur les noms de compte, reportez-vous à cette section [Snowflake document on account identifiers] (https://docs.snowflake.com/en/user-guide/admin-account-identifier.html).warehouse
database
username
password
role
public
.connectionSpec.id
51ae16c2-bdad-42fd-9fce-8d5dfddaf140
.Configuration des paramètres des rôles configure-role-settings
Vous devez configurer des privilèges sur un rôle, même si le rôle public par défaut est attribué, pour permettre à votre connexion source d’accéder aux Snowflake base de données, schéma et tableau. Les différents privilèges pour différents Snowflake entities se présente comme suit :
Pour plus d’informations sur la gestion des rôles et des privilèges, voir [Snowflake Référence d’API] (https://docs.snowflake.com/en/sql-reference/sql/grant-privilege).
Limites et questions fréquentes limitations-and-frequently-asked-questions
-
Débit des données pour la variable Snowflake source : 2 000 enregistrements par seconde.
-
Les tarifs peuvent varier en fonction de la durée d’activité d’un entrepôt et de sa taille. Pour le Snowflake l’intégration de la source, la plus petite taille, x-small warehouse est suffisante. Il est conseillé d’activer la suspension automatique afin que l’entrepôt puisse être suspendu seul lorsqu’il n’est pas utilisé.
-
La variable Snowflake source interroge la base de données pour obtenir de nouvelles données toutes les 10 secondes.
-
Options de configuration :
-
Vous pouvez activer une
backfill
indicateur booléen pour votre Snowflake source lors de la création d’une connexion source.- Si le renvoi est défini sur true, la valeur de timestamp.initial est définie sur 0. Cela signifie que les données dont la colonne d’horodatage est supérieure à 0 heure sont récupérées.
- Si le renvoi est défini sur false, la valeur de timestamp.initial est définie sur -1. Cela signifie que les données dont la colonne d’horodatage est supérieure à l’heure actuelle (l’heure à laquelle la source commence l’ingestion) sont récupérées.
-
La colonne d’horodatage doit être formatée comme type :
TIMESTAMP_LTZ
ouTIMESTAMP_NTZ
. Si la colonne d’horodatage est définie surTIMESTAMP_NTZ
, le fuseau horaire correspondant dans lequel les valeurs sont stockées doit être transmis via la variabletimezoneValue
. Si elle n’est pas fournie, la valeur est définie par défaut sur UTC.TIMESTAMP_TZ
ne peut pas être utilisé dans une colonne d’horodatage ou dans un mappage.
-
Étapes suivantes
Le tutoriel suivant décrit les étapes à suivre pour connecter votre Snowflake source de diffusion en continu vers l’Experience Platform à l’aide de l’API :
- Diffusion de données en continu à partir d’une Snowflake base de données à Experience Platform à l’aide de l’API Flow Service
- Diffusion de données en continu à partir d’une Snowflake base de données à Experience Platform à l’aide de l’espace de travail sources dans l’interface utilisateur Experience Platform