Transmitir datos de la base de datos Snowflake al Experience Platform mediante la interfaz de usuario
Aprenda a utilizar la interfaz de usuario para transmitir datos de la base de datos Snowflake a Adobe Experience Platform siguiendo esta guía.
Introducción
Este tutorial requiere una comprensión práctica de los siguientes componentes de Experience Platform:
-
Experience Data Model (XDM) Sistema: El marco de trabajo estandarizado mediante el cual Experience Platform organiza los datos de la experiencia del cliente.
- Aspectos básicos de la composición de esquemas: obtenga información sobre los componentes básicos de los esquemas XDM, incluidos los principios clave y las prácticas recomendadas en la composición de esquemas.
- Tutorial del editor de esquemas: Aprenda a crear esquemas personalizados mediante la interfaz de usuario del editor de esquemas.
-
Real-Time Customer Profile: proporciona un perfil de consumidor unificado y en tiempo real basado en los datos agregados de varias fuentes.
Autenticación
Lea la guía sobre la configuración de requisitos previos para Snowflake datos de transmisión para obtener información sobre los pasos que debe completar antes de poder ingerir datos de transmisión de Snowflake a Experience Platform.
Usar el origen Snowflake Streaming para transmitir datos de Snowflake al Experience Platform
En la interfaz de usuario de Platform, seleccione Sources en el panel de navegación izquierdo para acceder al área de trabajo Sources. Puede seleccionar la categoría adecuada del catálogo en la parte izquierda de la pantalla. También puede encontrar la fuente específica con la que desea trabajar utilizando la opción de búsqueda.
En la categoría Bases de datos, seleccione Snowflake Streaming y, a continuación, seleccione Agregar datos.
Aparecerá la página Conectar cuenta de flujo de Snowflake. En esta página, puede usar credenciales nuevas o existentes.
Para crear una cuenta nueva, selecciona Cuenta nueva y proporciona un nombre, una descripción opcional y tus credenciales.
Cuando termine, seleccione Conectarse al origen y deje pasar un tiempo para que se establezca la nueva conexión.
table 0-row-2 1-row-2 2-row-2 3-row-2 4-row-2 5-row-2 6-row-2 7-row-2 | |
---|---|
Credencial | Descripción |
Cuenta | El nombre de su cuenta de Snowflake. Para conocer las convenciones sobre los nombres de cuenta, lea la Snowflake Streaming guía de autenticación. |
Almacén | Nombre de su almacén de Snowflake. Los almacenes administran la ejecución de consultas en Snowflake. Cada almacén de Snowflake es independiente entre sí y se debe tener acceso a él de forma individual para llevar los datos al Experience Platform. |
Base de datos | Nombre de su base de datos Snowflake. La base de datos contiene los datos que desea llevar al Experience Platform. |
Esquema | (Opcional) El esquema de base de datos asociado con su cuenta de Snowflake. |
Nombre de usuario | El nombre de usuario de su cuenta de Snowflake. |
Contraseña | Contraseña de su cuenta de Snowflake. |
Función | (Opcional) Una función personalizada que se puede proporcionar a un usuario para una conexión determinada. Si no se proporciona, el valor predeterminado es public . |
Para obtener más información acerca de la creación de cuentas, lea la sección sobre configuración de funciones en la descripción general de Snowflake Streaming.
Para usar una cuenta existente, seleccione Cuenta existente y luego seleccione la cuenta que desee del catálogo de cuentas existente.
Seleccione Siguiente para continuar.
Seleccionar datos select-data
-
Debe existir una columna de marca de tiempo en la tabla de origen para poder crear un flujo de datos de flujo continuo. La marca de tiempo es necesaria para que el Experience Platform sepa cuándo se incorporarán los datos y cuándo se transmitirán los datos incrementales. Puede agregar de forma retroactiva una columna de marca de tiempo para una conexión existente y crear un nuevo flujo de datos.
-
Asegúrese de que las mayúsculas y minúsculas de los campos de datos del archivo de datos de origen de ejemplo cumplan las directrices de Snowflake sobre la resolución de mayúsculas y minúsculas para los identificadores. Lea el Snowflake documento sobre el uso de mayúsculas y minúsculas en el identificador para obtener más información.
Aparecerá el paso Seleccionar datos. En este paso, debe seleccionar los datos que desea importar en Experience Platform, configurar las marcas de tiempo y las zonas horarias, y proporcionar un archivo de datos de origen de muestra para la ingesta de datos sin procesar.
Utilice el directorio de base de datos de la izquierda de la pantalla y seleccione la tabla que desea importar al Experience Platform.
A continuación, seleccione el tipo de columna de marca de tiempo de la tabla. Puede seleccionar entre dos tipos de columnas de marca de tiempo: TIMESTAMP_NTZ
o TIMESTAMP_LTZ
. Si selecciona un tipo de columna de TIMESTAMP_NTZ
, también debe proporcionar una zona horaria. Las columnas no deben tener una restricción nula. Para obtener más información, lea la sección sobre [limitaciones y preguntas más frecuentes]
También puede configurar las opciones de relleno durante este paso. El relleno determina qué datos se incorporan inicialmente. Si el relleno está habilitado, todos los archivos actuales de la ruta especificada se introducirán durante la primera ingesta programada. Si no es así, solo se incorporarán los archivos que se carguen entre la primera ejecución de la ingesta y la hora de inicio. Los archivos cargados antes de la hora de inicio no se incorporarán.
Seleccione la opción Relleno para habilitar el relleno.
Finalmente, seleccione Elegir archivo para cargar un origen de datos de ejemplo para ayudar a crear el conjunto de asignaciones, que se utilizará en un paso posterior para asignar los datos originales al modelo de datos de experiencia (XDM).
Cuando termine, seleccione Siguiente para continuar.
Proporcionar detalles del conjunto de datos y flujo de datos provide-dataset-and-dataflow-details
A continuación, debe proporcionar información sobre el conjunto de datos y el flujo de datos.
Detalles del conjunto de datos dataset-details
Un conjunto de datos es una construcción de almacenamiento y administración para una colección de datos, normalmente una tabla, que contiene un esquema (columnas) y campos (filas). Los datos que se incorporan correctamente al Experience Platform se conservan dentro del lago de datos como conjuntos de datos. Durante este paso, puede crear un nuevo conjunto de datos o utilizar uno existente.
Para usar un nuevo conjunto de datos, seleccione Nuevo conjunto de datos y, a continuación, proporcione un nombre y una descripción opcional para su conjunto de datos. También debe seleccionar un esquema del Modelo de datos de experiencia (XDM) al que se adhiera el conjunto de datos.
table 0-row-2 1-row-2 2-row-2 3-row-2 | |
---|---|
Nuevos detalles del conjunto de datos | Descripción |
Nombre del conjunto de datos de salida | Nombre del nuevo conjunto de datos. |
Descripción | (Opcional) Una breve descripción general del nuevo conjunto de datos. |
Esquema | Una lista desplegable de esquemas que existen en su organización. También puede crear su propio esquema antes del proceso de configuración de origen. Para obtener más información, lea la guía sobre creación de un esquema XDM en la interfaz de usuario. |
Si ya tiene un conjunto de datos, seleccione Conjunto de datos existente y, a continuación, utilice la opción Búsqueda avanzada para ver una ventana de todos los conjuntos de datos de su organización, incluidos sus detalles respectivos, como si están habilitados para su ingesta en el Perfil del cliente en tiempo real.
Si el conjunto de datos está habilitado para Perfil del cliente en tiempo real, durante este paso, puede alternar Conjunto de datos de perfil para habilitar los datos para la ingesta de perfiles. También puede usar este paso para habilitar diagnósticos de error y ingesta parcial.
- Diagnósticos de error: seleccione Diagnósticos de error para indicar a la fuente que produzca diagnósticos de error a los que pueda hacer referencia posteriormente al supervisar la actividad del conjunto de datos y el estado del flujo de datos.
- Ingesta parcial: La ingesta parcial por lotes es la capacidad de ingerir datos que contengan errores, hasta un determinado umbral configurable. Esta función le permite introducir correctamente todos los datos precisos en Experience Platform, mientras que todos los datos incorrectos se agrupan por separado con información sobre los motivos por los que no son válidos.
Detalles del flujo de datos dataflow-details
Una vez configurado el conjunto de datos, debe proporcionar detalles sobre el flujo de datos, incluido un nombre, una descripción opcional y configuraciones de alerta.
El Experience Platform puede generar alertas basadas en eventos a las que los usuarios pueden suscribirse. Estas opciones requieren un flujo de datos en ejecución para almacenarlas en déclencheur. Para obtener más información, lea la descripción general de las alertas
- Inicio de ejecución del flujo de datos de origen: seleccione esta alerta para recibir una notificación cuando comience la ejecución del flujo de datos.
- Ejecución correcta del flujo de datos de origen: seleccione esta alerta para recibir una notificación si el flujo de datos termina sin errores.
- Error al ejecutar el flujo de datos de origen: seleccione esta alerta para recibir una notificación si la ejecución del flujo de datos termina con errores.
Cuando termine, seleccione Siguiente para continuar.
Asignación de campos a un esquema XDM mapping
Aparecerá el paso Mapping. Use la interfaz de asignación para asignar los datos de origen a los campos de esquema adecuados antes de ingerir esos datos en el Experience Platform y, a continuación, seleccione Siguiente. Para obtener una guía detallada sobre cómo usar la interfaz de asignación, lee la guía de la interfaz de usuario de la preparación de datos para obtener más información.
Revisión del flujo de datos review
El paso final del proceso de creación del flujo de datos es revisar el flujo de datos antes de ejecutarlo. Use el paso Revisar para revisar los detalles del nuevo flujo de datos antes de que se ejecute. Los detalles se agrupan en las siguientes categorías:
- Conexión: muestra el tipo de origen, la ruta de acceso relevante del archivo de origen elegido y el número de columnas dentro de ese archivo de origen.
- Asignar campos de conjunto de datos y asignación: muestra en qué conjunto de datos se están ingiriendo los datos de origen, incluido el esquema al que se adhiere el conjunto de datos.
Una vez que haya revisado el flujo de datos, seleccione Finalizar y espere un poco para que se cree el flujo de datos.
Pasos siguientes
Al seguir este tutorial, ha creado correctamente un flujo de datos de flujo continuo para Snowflake datos. Para obtener recursos adicionales, lea la documentación siguiente.
Monitorización del flujo de datos
Una vez creado el flujo de datos, puede monitorizar los datos que se están ingiriendo a través de él para ver información sobre las tasas de ingesta, el éxito y los errores. Para obtener más información sobre cómo supervisar los flujos de datos de flujo continuo, visite el tutorial sobre supervisión de flujos de datos de flujo continuo en la interfaz de usuario.
Actualizar el flujo de datos
Para actualizar configuraciones para la programación, asignación e información general de los flujos de datos, visite el tutorial sobre actualización de flujos de datos de origen en la interfaz de usuario.
Eliminar el flujo de datos
Puede eliminar flujos de datos que ya no sean necesarios o que se hayan creado incorrectamente mediante la función Delete disponible en el área de trabajo Flujos de datos. Para obtener más información sobre cómo eliminar flujos de datos, visite el tutorial sobre eliminar flujos de datos en la interfaz de usuario.