Configuración de un flujo de datos para una conexión de base de datos en la interfaz de usuario

Un flujo de datos es una tarea programada que recupera e incorpora datos de un origen a un conjunto de datos de Platform. Este tutorial proporciona pasos para configurar un nuevo flujo de datos con su cuenta de base de datos.

Primeros pasos

Este tutorial requiere una comprensión práctica de los siguientes componentes de Adobe Experience Platform:

Además, este tutorial requiere que ya haya creado una cuenta de base de datos. Puede encontrar una lista de tutoriales para crear diferentes conectores de base de datos en la interfaz de usuario en la información general de conectores de origen.

Seleccionar datos

Después de crear la cuenta de la base de datos, aparece el paso Select data, que proporciona una interfaz interactiva para explorar la jerarquía de la base de datos.

  • La mitad izquierda de la interfaz es un explorador que muestra la lista de bases de datos de su cuenta.
  • La mitad derecha de la interfaz permite previsualizar hasta 100 filas de datos.

Puede utilizar la opción Search en la parte superior de la página para identificar rápidamente los datos de origen que desea utilizar.

NOTA

La opción de datos de la fuente de búsqueda está disponible para todos los conectores de origen basados en tablas, excepto los conectores de Analytics, Clasificaciones, Centros de eventos y Kinesis.

Una vez que encuentre los datos de origen, seleccione el directorio y haga clic en Next.

select-data

Asignación de campos de datos a un esquema XDM

Aparece el paso Mapping, que proporciona una interfaz interactiva para asignar los datos de origen a un conjunto de datos de Platform.

Elija un conjunto de datos para los datos entrantes en los que se van a introducir. Puede usar un conjunto de datos existente o crear un conjunto de datos nuevo.

Usar un conjunto de datos existente

Para introducir datos en un conjunto de datos existente, seleccione Existing dataset y haga clic en el icono del conjunto de datos.

Aparece el cuadro de diálogo Select dataset. Busque el conjunto de datos que desea utilizar, selecciónelo y haga clic en Continue.

Usar un nuevo conjunto de datos

Para introducir datos en un nuevo conjunto de datos, seleccione New dataset e introduzca un nombre y una descripción para el conjunto de datos en los campos proporcionados.

Puede adjuntar un campo de esquema introduciendo un nombre de esquema en la barra de búsqueda Select schema. También puede seleccionar el icono desplegable para ver una lista de los esquemas existentes. Como alternativa, puede seleccionar Advanced search para acceder a la pantalla de los esquemas existentes, incluidos sus respectivos detalles.

Durante este paso, puede habilitar su conjunto de datos para Real-time Customer Profile y crear una vista holística de los atributos y comportamientos de una entidad. Los datos de todos los conjuntos de datos habilitados se incluirán en Profile y los cambios se aplicarán cuando guarde el flujo de datos.

Alterne el botón Profile dataset para habilitar el conjunto de datos de destino para Profile.

create-new-dataset

Aparece el cuadro de diálogo Select schema. Seleccione el esquema que desea aplicar al nuevo conjunto de datos y haga clic en Done.

En función de sus necesidades, puede elegir asignar campos directamente o utilizar funciones de asignador para transformar los datos de origen a fin de derivar valores calculados o calculados. Para obtener más información sobre las funciones de asignación y asignación de datos, consulte el tutorial sobre asignación de datos CSV a campos de esquema XDM.

CONSEJO

Platform proporciona recomendaciones inteligentes para campos asignados automáticamente basadas en el esquema o conjunto de datos de destino seleccionado. Puede ajustar manualmente las reglas de asignación para adaptarlas a sus casos de uso.

Seleccione Preview data para ver los resultados de asignación de hasta 100 filas de datos de ejemplo del conjunto de datos seleccionado.

Durante la vista previa, la columna de identidad se prioriza como el primer campo, ya que es la información clave necesaria al validar los resultados de la asignación.

Una vez asignados los datos de origen, seleccione Close.

Programar ejecuciones de ingesta

Aparece el paso Scheduling , que le permite configurar una programación de ingesta para que ingrese automáticamente los datos de origen seleccionados mediante las asignaciones configuradas. La siguiente tabla describe los diferentes campos configurables para la programación:

Campo Descripción
Frecuencia Las frecuencias seleccionables incluyen Once, Minute, Hour, Day y Week.
Intervalo Un entero que define el intervalo para la frecuencia seleccionada.
Hora de inicio Marca de tiempo UTC que indica cuándo se configura la primera ingesta.
Relleno Un valor booleano que determina qué datos se introducen inicialmente. Si Backfill está habilitado, todos los archivos actuales de la ruta especificada se incorporarán durante la primera ingesta programada. Si Backfill está desactivado, solo se incorporarán los archivos que se cargan entre la primera ejecución de la ingesta y la hora de inicio. Los archivos cargados antes de la hora de inicio no se incorporarán.
Columna Delta Una opción con un conjunto filtrado de campos de esquema de origen de tipo, fecha u hora. Este campo se utiliza para diferenciar entre datos nuevos y existentes. Los datos incrementales se incorporarán en función de la marca de tiempo de la columna seleccionada.

Los flujos de datos están diseñados para introducir datos automáticamente y de forma programada. Comience por seleccionar la frecuencia de ingesta. A continuación, configure el intervalo para designar el periodo entre dos ejecuciones de flujo. El valor del intervalo debe ser un entero distinto de cero y debe establecerse en bueno o igual a 15.

Para definir la hora de inicio de la ingesta, ajuste la fecha y la hora que se muestran en el cuadro de hora de inicio. También puede seleccionar el icono de calendario para editar el valor de la hora de inicio. La hora de inicio debe ser buena o igual a la hora UTC actual.

Seleccione Load incremental data by para asignar la columna delta. Este campo proporciona una distinción entre datos nuevos y existentes.

Configurar un flujo de datos de ingesta único

Para configurar la ingesta única, seleccione la flecha desplegable de frecuencia y seleccione Once.

CONSEJO

Interval y no Backfill son visibles durante una ingesta única.

Una vez que haya proporcionado los valores adecuados a la programación, seleccione Next.

Proporcionar detalles de flujo de datos

Aparece el paso Dataflow detail, que le permite dar un nombre y una breve descripción del nuevo flujo de datos.

Durante este proceso, también puede habilitar Partial ingestion y Error diagnostics. Al habilitar Partial ingestion se puede ingerir datos que contengan errores hasta un umbral determinado. Una vez que Partial ingestion esté habilitado, arrastre el dial Error threshold % para ajustar el umbral de error del lote. Como alternativa, puede ajustar manualmente el umbral seleccionando el cuadro de entrada. Para obtener más información, consulte la información general sobre la ingesta parcial de lotes.
Proporcione valores para el flujo de datos y seleccione Next.

Revise el flujo de datos

Aparece el paso Review, que le permite revisar el nuevo flujo de datos antes de crearlo. Los detalles se agrupan en las siguientes categorías:

  • Connection: Muestra el tipo de origen, la ruta correspondiente del archivo de origen elegido y la cantidad de columnas dentro de ese archivo de origen.
  • Assign dataset & map fields: Muestra en qué conjunto de datos se están incorporando los datos de origen, incluido el esquema al que se adhiere el conjunto de datos.
  • Scheduling: Muestra el período, la frecuencia y el intervalo activos del programa de ingesta.

Una vez que haya revisado el flujo de datos, haga clic en Finish y permita que se cree el flujo de datos.

Monitorizar el flujo de datos

Una vez creado el flujo de datos, puede monitorizar los datos que se incorporan a través de él para ver información sobre las tasas de ingesta, el éxito y los errores. Para obtener más información sobre cómo monitorizar el flujo de datos, consulte el tutorial sobre monitorización de cuentas y flujos de datos en la interfaz de usuario.

Eliminar el flujo de datos

Puede eliminar flujos de datos que ya no sean necesarios o que se hayan creado incorrectamente utilizando la función Delete disponible en el espacio de trabajo Dataflows. Para obtener más información sobre cómo eliminar flujos de datos, consulte el tutorial sobre la eliminación de flujos de datos en la interfaz de usuario.

Pasos siguientes

Al seguir este tutorial, ha creado correctamente un flujo de datos para incorporar datos de una base de datos externa y ha obtenido información sobre la monitorización de conjuntos de datos. Los datos entrantes ahora se pueden usar en servicios descendentes Platform como Real-time Customer Profile y Data Science Workspace. Consulte los siguientes documentos para obtener más información:

Apéndice

Las secciones siguientes proporcionan información adicional para trabajar con conectores de origen.

Desactivación de un flujo de datos

Cuando se crea un flujo de datos, este se activa inmediatamente e ingresa los datos según la programación que se le haya dado. Puede deshabilitar un flujo de datos activo en cualquier momento siguiendo las instrucciones que se indican a continuación.

Dentro del espacio de trabajo Sources , seleccione la pestaña Dataflows . A continuación, seleccione el flujo de datos que desea desactivar.

La columna Properties aparece en el lado derecho de la pantalla, incluido un botón de alternancia Enabled. Seleccione la opción para desactivar el flujo de datos. Se puede utilizar la misma opción para volver a habilitar un flujo de datos una vez desactivado.

Activar datos de entrada para la población Profile

Los datos de entrada del conector de origen se pueden utilizar para enriquecer y rellenar los datos Real-time Customer Profile. Para obtener más información sobre cómo rellenar los datos Real-time Customer Profile, consulte el tutorial sobre Población del perfil.

En esta página