Configuración de un flujo de datos para una conexión de base de datos en la interfaz de usuario

Un flujo de datos es una tarea programada que recupera e incorpora datos de un origen a un conjunto de datos de Platform. Este tutorial proporciona pasos para configurar un nuevo flujo de datos con su cuenta de base de datos.

Primeros pasos

Este tutorial requiere una comprensión práctica de los siguientes componentes de Adobe Experience Platform:

Además, este tutorial requiere que ya haya creado una cuenta de base de datos. Puede encontrar una lista de tutoriales para crear diferentes conectores de base de datos en la interfaz de usuario en la información general de conectores de origen.

Añadir datos

Después de crear la cuenta de la base de datos, aparece el paso Add data, que proporciona una interfaz interactiva para explorar la jerarquía de la base de datos.

  • La mitad izquierda de la interfaz es un navegador que muestra la lista de tablas de datos de su cuenta.
  • La mitad derecha de la interfaz permite previsualizar hasta 100 filas de datos.

Puede utilizar la opción Search en la parte superior de la página para identificar rápidamente los datos de origen que desea utilizar.

NOTA

La opción de datos de la fuente de búsqueda está disponible para todos los conectores de origen basados en tablas, excepto los conectores de Analytics, Clasificaciones, Centros de eventos y Kinesis.

Una vez que encuentre los datos de origen, seleccione la tabla y, a continuación, seleccione Next.

select-data

Asignación de campos de datos a un esquema XDM

Aparece el paso Mapping, que proporciona una interfaz interactiva para asignar los datos de origen a un conjunto de datos de Platform.

Elija un conjunto de datos para los datos entrantes en los que se van a introducir. Puede usar un conjunto de datos existente o crear un conjunto de datos nuevo.

Usar un conjunto de datos existente

Para introducir datos en un conjunto de datos existente, seleccione Conjunto de datos existente y, a continuación, haga clic en el icono del conjunto de datos.

Aparece el cuadro de diálogo Seleccionar conjunto de datos. Busque el conjunto de datos que desea utilizar, selecciónelo y haga clic en Continuar.

Usar un nuevo conjunto de datos

Para introducir datos en un nuevo conjunto de datos, seleccione Nuevo conjunto de datos e introduzca un nombre y una descripción para el conjunto de datos en los campos proporcionados.

Puede adjuntar un campo de esquema introduciendo un nombre de esquema en la barra de búsqueda Select schema. También puede seleccionar el icono desplegable para ver una lista de los esquemas existentes. Como alternativa, puede seleccionar Búsqueda avanzada para acceder a la pantalla de esquemas existentes, incluidos sus respectivos detalles.

Durante este paso, puede habilitar su conjunto de datos para Real-time Customer Profile y crear una vista holística de los atributos y comportamientos de una entidad. Los datos de todos los conjuntos de datos habilitados se incluirán en Profile y los cambios se aplicarán cuando guarde el flujo de datos.

Alterne el botón Profile dataset para habilitar el conjunto de datos de destinatario para Profile.

create-new-dataset

Aparece el cuadro de diálogo Select schema. Seleccione el esquema que desea aplicar al nuevo conjunto de datos y haga clic en Listo.

En función de sus necesidades, puede elegir asignar campos directamente o utilizar funciones de preparación de datos para transformar los datos de origen a fin de derivar valores calculados o calculados. Para obtener más información sobre las funciones del asignador y los campos calculados, consulte la Guía de funciones de preparación de datos o la guía de campos calculados.

SUGERENCIA

Platform proporciona recomendaciones inteligentes para campos asignados automáticamente basadas en el esquema o conjunto de datos de destino seleccionado. Puede ajustar manualmente las reglas de asignación para adaptarlas a sus casos de uso.

Seleccione Preview data para ver los resultados de asignación de hasta 100 filas de datos de ejemplo del conjunto de datos seleccionado.

Durante la vista previa, la columna de identidad se prioriza como el primer campo, ya que es la información clave necesaria al validar los resultados de la asignación.

Una vez asignados los datos de origen, seleccione Close.

Programar ejecuciones de ingesta

Aparece el paso Scheduling , que le permite configurar una programación de ingesta para que ingrese automáticamente los datos de origen seleccionados mediante las asignaciones configuradas. La siguiente tabla describe los diferentes campos configurables para la programación:

Campo Descripción
Frecuencia Las frecuencias seleccionables incluyen Once, Minute, Hour, Day y Week.
Intervalo Un entero que define el intervalo para la frecuencia seleccionada.
Hora de inicio Marca de tiempo UTC que indica cuándo se configura la primera ingesta.
Relleno Un valor booleano que determina qué datos se introducen inicialmente. Si Relleno de fondo está habilitado, todos los archivos actuales de la ruta especificada se incorporarán durante la primera ingesta programada. Si Backfill está deshabilitado, solo se incorporarán los archivos que se carguen entre la primera ejecución de la ingesta y la hora de inicio. Los archivos cargados antes de la hora de inicio no se incorporarán.
Columna Delta Una opción con un conjunto filtrado de campos de esquema de origen de tipo, fecha u hora. Este campo se utiliza para diferenciar entre datos nuevos y existentes. Los datos incrementales se incorporarán en función de la marca de tiempo de la columna seleccionada.

Los flujos de datos están diseñados para introducir datos automáticamente y de forma programada. Comience por seleccionar la frecuencia de ingesta. A continuación, configure el intervalo para designar el periodo entre dos ejecuciones de flujo. El valor del intervalo debe ser un entero distinto de cero y debe establecerse en bueno o igual a 15.

Para definir la hora de inicio de la ingesta, ajuste la fecha y la hora que se muestran en el cuadro de hora de inicio. También puede seleccionar el icono de calendario para editar el valor de la hora de inicio. La hora de inicio debe ser buena o igual a la hora UTC actual.

Seleccione Cargar datos incrementales por para asignar la columna delta. Este campo proporciona una distinción entre datos nuevos y existentes.

Configurar un flujo de datos de ingesta único

Para configurar la ingesta única, seleccione la flecha desplegable de frecuencia y seleccione Once.

SUGERENCIA

El ​relleno de intervalación no es visible durante una ingesta única.

Una vez que haya proporcionado los valores adecuados a la programación, seleccione Next.

Proporcionar detalles de flujo de datos

Aparece el paso Dataflow detail, que le permite dar un nombre y una breve descripción del nuevo flujo de datos.

Durante este proceso, también puede habilitar la ingesta parcial y los diagnósticos de error. Al habilitar la ingesta parcial se puede ingerir datos que contengan errores hasta un umbral determinado. Una vez activada la Ingesta parcial, arrastre el dial Error threshold % para ajustar el umbral de error del lote. Como alternativa, puede ajustar manualmente el umbral seleccionando el cuadro de entrada. Para obtener más información, consulte la información general sobre la ingesta parcial de lotes.
Proporcione valores para el flujo de datos y seleccione Next.

Revise el flujo de datos

Aparece el paso Review, que le permite revisar el nuevo flujo de datos antes de crearlo. Los detalles se agrupan en las siguientes categorías:

  • Conexión: Muestra el tipo de origen, la ruta correspondiente del archivo de origen elegido y la cantidad de columnas dentro de ese archivo de origen.
  • Asignar campos de conjunto de datos y asignación: Muestra en qué conjunto de datos se están incorporando los datos de origen, incluido el esquema al que se adhiere el conjunto de datos.
  • Programación: Muestra el período, la frecuencia y el intervalo activos del programa de ingesta.

Una vez que haya revisado el flujo de datos, haga clic en Finish y permita que se cree el flujo de datos.

Monitorizar el flujo de datos

Una vez creado el flujo de datos, puede monitorizar los datos que se incorporan a través de él para ver información sobre las tasas de ingesta, el éxito y los errores. Para obtener más información sobre cómo monitorizar el flujo de datos, consulte el tutorial sobre monitorización de cuentas y flujos de datos en la interfaz de usuario.

Eliminar el flujo de datos

Puede eliminar flujos de datos que ya no sean necesarios o que se hayan creado incorrectamente empleando la función Delete disponible en el espacio de trabajo Dataflows. Para obtener más información sobre cómo eliminar flujos de datos, consulte el tutorial sobre la eliminación de flujos de datos en la interfaz de usuario.

Pasos siguientes

Al seguir este tutorial, ha creado correctamente un flujo de datos para incorporar datos de una base de datos externa y ha obtenido información sobre la monitorización de conjuntos de datos. Los datos entrantes ahora se pueden usar en servicios descendentes Platform como Real-time Customer Profile y Data Science Workspace. Consulte los siguientes documentos para obtener más información:

Apéndice

Las secciones siguientes proporcionan información adicional para trabajar con conectores de origen.

Desactivación de un flujo de datos

Cuando se crea un flujo de datos, este se activa inmediatamente e ingresa los datos según la programación que se le haya dado. Puede deshabilitar un flujo de datos activo en cualquier momento siguiendo las instrucciones que se indican a continuación.

En el espacio de trabajo Sources, seleccione la pestaña Dataflows. A continuación, seleccione el flujo de datos que desea desactivar.

La columna Properties aparece en el lado derecho de la pantalla, incluido un botón de alternancia Enabled. Seleccione la opción para desactivar el flujo de datos. Se puede utilizar la misma opción para volver a habilitar un flujo de datos una vez desactivado.

Activar datos de entrada para la población Profile

Los datos de entrada del conector de origen se pueden utilizar para enriquecer y rellenar los datos Real-time Customer Profile. Para obtener más información sobre cómo rellenar los datos Real-time Customer Profile, consulte el tutorial sobre Población del perfil.

En esta página