[Beta]{class="badge informative"} [Ultimate]{class="badge positive"}
Snowflake fuente de transmisión
- El Snowflake la fuente de streaming está en versión beta. Lea el Resumen de orígenes para obtener más información sobre el uso de fuentes etiquetadas como beta.
- El Snowflake La fuente de streaming está disponible en la API para los usuarios que han adquirido Real-time Customer Data Platform Ultimate.
Adobe Experience Platform permite la ingesta de datos desde fuentes externas, al tiempo que le ofrece la capacidad de estructurar, etiquetar y mejorar los datos entrantes mediante los servicios de Platform. Puede introducir datos de una variedad de fuentes, como aplicaciones de Adobe, almacenamiento basado en la nube, bases de datos y muchas otras.
El Experience Platform de proporciona asistencia para la transmisión de datos desde un Snowflake base de datos.
Explicación de la Snowflake fuente de transmisión
El Snowflake El origen de flujo continuo funciona teniendo datos cargados ejecutando periódicamente una consulta SQL y creando un registro de salida para cada fila en el conjunto resultante.
Mediante Kafka Connect, el Snowflake streaming source realiza el seguimiento del último registro que recibe de cada tabla, de modo que pueda comenzar en la ubicación correcta para la siguiente iteración. El origen utiliza esta funcionalidad para filtrar los datos y obtener solo las filas actualizadas de una tabla en cada iteración.
Requisitos previos
En la siguiente sección se describen los pasos necesarios que deben seguirse para poder transmitir datos desde la Snowflake base de datos a Experience Platform:
Recopilar credenciales necesarias
Para que Flow Service para conectar con Snowflake, debe proporcionar las siguientes propiedades de conexión:
account
cj12345.east-us-2.azure
. Para obtener más información sobre los nombres de cuenta, consulte esta sección [Snowflake document on account identifiers] (https://docs.snowflake.com/en/user-guide/admin-account-identifier.html).warehouse
database
username
password
role
public
.connectionSpec.id
51ae16c2-bdad-42fd-9fce-8d5dfddaf140
.Configurar las opciones de rol configure-role-settings
Debe configurar privilegios en un rol, incluso si se asigna el rol público predeterminado, para permitir que la conexión de origen acceda al correspondiente Snowflake base de datos, esquema y tabla. Los distintos privilegios para diferentes Snowflake entidades es la siguiente:
Para obtener más información sobre la administración de roles y privilegios, consulte la [Snowflake Referencia de API] (https://docs.snowflake.com/en/sql-reference/sql/grant-privilege).
Limitaciones y preguntas más frecuentes limitations-and-frequently-asked-questions
-
El rendimiento de los datos para Snowflake fuente: 2000 registros por segundo.
-
Los precios pueden variar según la cantidad de tiempo que un almacén esté activo y el tamaño del almacén. Para el Snowflake integración fuente, el tamaño más pequeño, x-pequeño almacén es suficiente. Se recomienda habilitar la suspensión automática para que el almacén pueda suspender por sí solo cuando no esté en uso.
-
El Snowflake El origen sondea la base de datos en busca de nuevos datos cada 10 segundos.
-
Opciones de Configuration:
-
Puede activar un
backfill
indicador booleano para su Snowflake origen al crear una conexión de origen.- Si el relleno se establece en true, el valor de timestamp.initial se establece en 0. Esto significa que se recuperan los datos con una columna de marca de tiempo mayor que 0 epoch time.
- Si el relleno se establece en False, el valor de timestamp.initial se establece en -1. Esto significa que se recuperan datos con una columna de marca de tiempo mayor que la hora actual (la hora en la que el origen comienza a ingerir).
-
La columna de marca de tiempo debe tener el formato tipo:
TIMESTAMP_LTZ
oTIMESTAMP_NTZ
. Si la columna de marca de tiempo se establece enTIMESTAMP_NTZ
, la zona horaria correspondiente en la que se almacenan los valores debe pasarse a través detimezoneValue
parámetro. Si no se proporciona, el valor predeterminado será UTC.TIMESTAMP_TZ
no se puede utilizar en una columna de marca de tiempo o en una asignación.
-
Pasos siguientes
El siguiente tutorial proporciona pasos sobre cómo conectar su Snowflake fuente de streaming al Experience Platform mediante la API: