Documentación Experience Platform Guía de conectores de origen

Creación de un flujo de datos mediante una fuente de base de datos en la IU

Last update: Wed Oct 29 2025 00:00:00 GMT+0000 (Coordinated Universal Time)

Temas:

Creado para:

Desarrollador

Un flujo de datos es una tarea programada que recupera e ingiere datos de un origen a un conjunto de datos en Adobe Experience Platform. Este tutorial proporciona pasos sobre cómo crear un flujo de datos para un origen de base de datos mediante la interfaz de usuario de Experience Platform.

NOTE

Para crear un flujo de datos, ya debe tener una cuenta autenticada con un origen de base de datos. Encontrará una lista de tutoriales para crear diferentes cuentas de origen de base de datos en la interfaz de usuario en descripción general de orígenes.
Para que Experience Platform pueda introducir datos, las zonas horarias de todos los orígenes de lotes basados en tablas deben configurarse en UTC. La única marca de tiempo compatible con Snowflake source es TIMESTAMP_NTZ con hora UTC.

Introducción

Este tutorial requiere una comprensión práctica de los siguientes componentes de Experience Platform:

Fuentes: Experience Platform permite la ingesta de datos de varias fuentes al tiempo que le ofrece la capacidad de estructurar, etiquetar y mejorar los datos entrantes mediante los servicios de Experience Platform.
Experience Data Model (XDM) Sistema: El marco estandarizado mediante el cual Experience Platform organiza los datos de experiencia del cliente.
- Aspectos básicos de la composición de esquemas: obtenga información sobre los componentes básicos de los esquemas XDM, incluidos los principios clave y las prácticas recomendadas en la composición de esquemas.
- Tutorial del editor de esquemas: Aprenda a crear esquemas personalizados mediante la interfaz de usuario del editor de esquemas.
Real-Time Customer Profile: proporciona un perfil de consumidor unificado y en tiempo real basado en los datos agregados de varias fuentes.
Data Prep: permite a los ingenieros de datos asignar, transformar y validar datos desde y hacia el modelo de datos de experiencia (XDM).

Adición de datos

Después de crear la cuenta de origen de base de datos, aparece el paso Add data, que proporciona una interfaz para explorar la jerarquía de tablas de la cuenta de origen de base de datos.

La mitad izquierda de la interfaz es un navegador que muestra una lista de tablas de datos incluidas en su cuenta. La interfaz también incluye una opción de búsqueda que le permite identificar rápidamente los datos de origen que desea utilizar.
La mitad derecha de la interfaz es un panel de previsualización, que le permite previsualizar hasta 100 filas de datos.

NOTE

La opción de búsqueda de datos de origen está disponible para todos los orígenes basados en tablas excepto Adobe Analytics, Amazon Kinesis y Azure Event Hubs.

Cuando encuentre los datos de origen, seleccione la tabla y, a continuación, seleccione Next.

select-data

Proporcionar detalles del flujo de datos

La página Dataflow detail le permite seleccionar si desea utilizar un conjunto de datos existente o uno nuevo. Durante este proceso, también puede establecer la configuración de Profile dataset, Error diagnostics, Partial ingestion y Alerts.

detalle de flujo de datos

Usar un conjunto de datos existente

Para introducir datos en un conjunto de datos existente, seleccione Existing dataset. Puede recuperar un conjunto de datos existente mediante la opción Advanced search o desplazándose por la lista de conjuntos de datos existentes en el menú desplegable. Una vez seleccionado un conjunto de datos, proporcione un nombre y una descripción para el flujo de datos.

conjunto de datos existente

Usar un nuevo conjunto de datos

Para realizar la ingesta en un nuevo conjunto de datos, seleccione New dataset y, a continuación, proporcione un nombre de conjunto de datos de salida y una descripción opcional. A continuación, seleccione un esquema al que asignar con la opción Advanced search o desplazándose por la lista de esquemas existentes en el menú desplegable. Una vez seleccionado un esquema, proporcione un nombre y una descripción para el flujo de datos.

nuevo conjunto de datos

Habilitar Profile y los diagnósticos de error

A continuación, seleccione la opción Profile dataset para habilitar el conjunto de datos para Profile. Esto le permite crear una vista integral de los atributos y comportamientos de una entidad. Los datos de todos los conjuntos de datos habilitados para Profile se incluirán en Profile y los cambios se aplicarán al guardar el flujo de datos.

Error diagnostics permite la generación detallada de mensajes de error para cualquier registro erróneo que ocurra en el flujo de datos, mientras que Partial ingestion le permite introducir datos que contengan errores, hasta un determinado umbral que defina manualmente. Consulte la descripción general de la ingesta parcial por lotes para obtener más información.

perfil y errores

Habilitar alertas

Puede activar alertas para recibir notificaciones sobre el estado del flujo de datos. Seleccione una alerta de la lista a la que suscribirse para recibir notificaciones sobre el estado del flujo de datos. Para obtener más información sobre las alertas, consulte la guía sobre suscripción a alertas de fuentes mediante la interfaz de usuario.

Cuando termine de proporcionar detalles al flujo de datos, seleccione Next.

alertas

Asignación de campos de datos a un esquema XDM

Aparecerá el paso Mapping, que le proporcionará una interfaz para asignar los campos de origen del esquema de origen a sus campos XDM de destino adecuados en el esquema de destino.

Experience Platform proporciona recomendaciones inteligentes para campos asignados automáticamente en función del esquema o conjunto de datos de destino seleccionado. Puede ajustar manualmente las reglas de asignación para adaptarlas a sus casos de uso. En función de sus necesidades, puede elegir asignar campos directamente o utilizar funciones de preparación de datos para transformar los datos de origen y derivar valores calculados o calculados. Para ver los pasos detallados sobre el uso de la interfaz de asignador y los campos calculados, consulte la guía de la interfaz de usuario de la preparación de datos.

NOTE

Al asignar a esquemas relacionales, asegúrese de que los datos de origen incluyan los campos obligatorios, como una clave principal y un identificador de versión, o un identificador de marca de tiempo para esquemas de series temporales,

Las columnas de control como _change_request_type, utilizadas para la captura de datos modificados, se leen durante la ingesta, pero no se almacenan en el esquema de destino.

Los esquemas relacionales también admiten relaciones entre conjuntos de datos mediante asignaciones de clave principal y externa.

Para obtener más información, consulte la descripción general de Data Mirror y la referencia técnica de esquemas relacionales.

Una vez que los datos de origen se hayan asignado correctamente, seleccione Next.

asignación

Programar ejecuciones de ingesta

Aparece el paso Scheduling, que le permite configurar una programación de ingesta para que introduzca automáticamente los datos de origen seleccionados mediante las asignaciones configuradas. De manera predeterminada, la programación se establece en Once. Para ajustar la frecuencia de ingesta, seleccione Frequency y luego elija una opción en el menú desplegable.

TIP

El intervalo y el relleno no son visibles durante una ingesta única.

programación

Si establece la frecuencia de ingesta en Minute, Hour, Day o Week, debe establecer un intervalo para establecer un intervalo de tiempo establecido entre cada ingesta. Por ejemplo, una frecuencia de ingesta establecida en Day y un intervalo establecido en 15 significa que el flujo de datos está programado para ingerir datos cada 15 días.

Durante este paso, también puede habilitar relleno y definir una columna para la ingesta incremental de datos. El relleno se utiliza para introducir datos históricos, mientras que la columna que defina para la ingesta incremental permite diferenciar los nuevos datos de los datos existentes.

Consulte la tabla siguiente para obtener más información sobre las configuraciones de programación.

Configuración de programación

Descripción

Frecuencia

Configure la frecuencia para indicar con qué frecuencia debe ejecutarse el flujo de datos. Puede establecer su frecuencia en:

Una vez: establezca su frecuencia en once para crear una ingesta única. Las configuraciones para intervalo y relleno no están disponibles al crear un flujo de datos de ingesta único. De forma predeterminada, la frecuencia de programación se establece en una vez.
Minuto: establezca su frecuencia en minute para programar el flujo de datos e ingerir datos por minuto.
Hora: establezca su frecuencia en hour para programar el flujo de datos e ingerir datos por hora.
Día: Establezca su frecuencia en day para programar su flujo de datos e ingerir datos por día.
Semana: establezca su frecuencia en week para programar el flujo de datos e ingerir datos por semana. Para obtener más información, lea la sección sobre [comprensión de la programación semanal de ingesta] (#weekly).

Intervalo

Una vez seleccionada una frecuencia, puede configurar la configuración del intervalo para establecer el lapso de tiempo entre cada ingesta. Por ejemplo, si establece la frecuencia en día y configura el intervalo en 15, el flujo de datos se ejecutará cada 15 días. No puede establecer el intervalo en cero. El valor mínimo del intervalo aceptado para cada frecuencia es el siguiente:

Una vez: n/a
Minuto: 15
Hora: 1
Día: 1
Semana: 1

Hora de inicio

La marca de tiempo de la ejecución proyectada, presentada en la zona horaria UTC.

Relleno

El relleno determina qué datos se incorporan inicialmente. Si el relleno está habilitado, todos los archivos actuales de la ruta especificada se introducirán durante la primera ingesta programada. Si se desactiva el relleno, solo se incorporarán los archivos que se carguen entre la primera ejecución de la ingesta y la hora de inicio. Los archivos cargados antes de la hora de inicio no se incorporarán.

Cargar datos incrementales por

Una opción con un conjunto filtrado de campos de esquema de origen de tipo, fecha u hora. El campo que seleccione para Load incremental data by debe tener sus valores de fecha y hora en la zona horaria UTC para cargar correctamente los datos incrementales. Todos los orígenes de lotes basados en tablas seleccionan datos incrementales comparando un valor de marca de tiempo de columna delta con el correspondiente tiempo UTC de la ventana de ejecución de flujo y copiando los datos del origen, si se encuentran nuevos datos dentro de la ventana de tiempo UTC.

relleno

Explicación de la programación semanal de ingesta weekly

Cuando elija establecer el flujo de datos para que se ejecute en una programación semanal, el flujo de datos se ejecutará en función de uno de estos escenarios:

Si se ha creado la fuente de datos pero aún no se han introducido datos, el primer flujo de datos semanal se ejecutará 7 días después de la fecha de creación de la fuente. Este intervalo de 7 días siempre comienza desde el momento en que se creó el origen, independientemente del momento en que se configure la programación. Después de la ejecución inicial, el flujo de datos seguirá ejecutándose semanalmente según la programación configurada.
Si los datos de su origen se han introducido anteriormente y lo programa para la ingesta semanal de nuevo, el siguiente flujo de datos se ejecutará 7 días después de la ingesta correcta más reciente.

Revisión del flujo de datos

Aparece el paso Review, que le permite revisar el nuevo flujo de datos antes de crearlo. Los detalles se agrupan en las siguientes categorías:

Connection: muestra el tipo de origen, la ruta de acceso relevante del archivo de origen elegido y la cantidad de columnas dentro de ese archivo de origen.
Assign dataset & map fields: muestra el conjunto de datos en el que se incorporarán los datos de origen, junto con el esquema asociado. Si utiliza un esquema relacional, compruebe que los campos obligatorios, como la clave principal y el identificador de versión, estén asignados correctamente. Asegúrese también de que las columnas de control de captura de datos cambiadas están configuradas correctamente. Los conjuntos de datos que utilizan esquemas relacionales admiten varios modelos de datos y habilitan cambiar flujos de trabajo de captura de datos.
Scheduling: muestra el período activo, la frecuencia y el intervalo de la programación de ingesta.

Una vez que haya revisado el flujo de datos, seleccione Finish y espere un poco para que se cree el flujo de datos.

revisión

Monitorización del flujo de datos

Una vez creado el flujo de datos, puede monitorizar los datos que se están ingiriendo a través de él para ver información sobre las tasas de ingesta, el éxito y los errores. Para obtener más información sobre cómo supervisar el flujo de datos, consulte el tutorial sobre supervisar cuentas y flujos de datos en la interfaz de usuario.

Eliminar el flujo de datos

Puede eliminar los flujos de datos que ya no son necesarios o que se crearon incorrectamente mediante la función Delete disponible en el área de trabajo Dataflows. Para obtener más información sobre cómo eliminar flujos de datos, consulte el tutorial sobre eliminar flujos de datos en la interfaz de usuario.

Próximos pasos

Al seguir este tutorial, ha creado correctamente un flujo de datos para llevar los datos del origen de la base de datos a Experience Platform. Los datos entrantes ahora pueden ser utilizados por servicios de flujo descendente Experience Platform como Real-Time Customer Profile y Data Science Workspace. Consulte los siguientes documentos para obtener más información:

recommendation-more-help

337b99bb-92fb-42ae-b6b7-c7042161d089