Un flujo de datos es una tarea programada que recupera e ingiere datos de un origen a un Platform conjunto de datos. Este tutorial proporciona pasos para configurar un nuevo flujo de datos con su cuenta de eCommerce .
Este tutorial requiere un conocimiento práctico de los siguientes componentes de Adobe Experience Platform:
Además, este tutorial requiere que ya haya creado una cuenta de comercio electrónico. Encontrará una lista de tutoriales para crear diferentes conectores de comercio electrónico en la interfaz de usuario en la descripción general de los conectoresde origen.
Después de crear la cuenta de eCommerce , aparece el paso Seleccionar datos , que proporciona una interfaz interactiva para explorar la jerarquía de archivos.
Puede utilizar la opción Buscar en la parte superior de la página para identificar rápidamente los datos de origen que desee utilizar.
La opción de datos de origen de búsqueda está disponible para todos los conectores de origen basados en tabulaciones, excluyendo los conectores de Analytics, Clasificaciones, Eventos y Kinesis.
Una vez que encuentre los datos de origen, seleccione el directorio y luego Siguiente.
Aparece el paso Asignación , que proporciona una interfaz interactiva para asignar los datos de origen a un Platform conjunto de datos.
Elija un conjunto de datos para los datos de entrada en los que se van a ingerir. Puede utilizar un conjunto de datos existente o crear un nuevo conjunto de datos.
Para ingerir datos en un conjunto de datos existente, seleccione Utilizar conjunto de datos existente y, a continuación, haga clic en el icono de conjunto de datos.
Aparece el cuadro de diálogo Seleccionar conjunto de datos . Busque el conjunto de datos que desee utilizar, selecciónelo y haga clic en Continuar.
Para ingestar datos en un nuevo conjunto de datos, seleccione Crear nuevo conjunto de datos e introduzca un nombre y una descripción para el conjunto de datos en los campos proporcionados.
Puede adjuntar un campo de esquema introduciendo un nombre de esquema en la barra de búsqueda Seleccionar esquema . También puede seleccionar el icono desplegable para ver una lista de esquemas existentes. También puede seleccionar Búsqueda avanzada para acceder a la pantalla de esquemas existentes, incluidos sus respectivos detalles.
Durante este paso, puede habilitar el conjunto de datos Real-time Customer Profile y crear una vista holística de los atributos y comportamientos de una entidad. Se incluirán los datos de todos los conjuntos de datos habilitados Profile y se aplicarán los cambios al guardar el flujo de datos.
Alterne el botón Perfil dataset para habilitar el conjunto de datos de destinatario para Profile.
Aparecerá el cuadro de diálogo Seleccionar esquema . Seleccione el esquema que desee aplicar al nuevo conjunto de datos y haga clic en Finalizado.
En función de sus necesidades, puede elegir asignar los campos directamente o utilizar funciones de asignador para transformar los datos de origen para derivar valores calculados o calculados. Para obtener más información sobre la asignación de datos y las funciones del asignador, consulte el tutorial sobre la asignación de datos CSV a camposde esquema XDM.
Platform proporciona recomendaciones inteligentes para campos asignados automáticamente en función del esquema de destinatario o del conjunto de datos que haya seleccionado. Puede ajustar manualmente las reglas de asignación para adaptarlas a sus casos de uso.
Seleccione los datos de Previsualización para ver los resultados de asignación de hasta 100 filas de datos de muestra del conjunto de datos seleccionado.
Durante la previsualización, se da prioridad a la columna de identidad como primer campo, ya que es la información clave necesaria para validar los resultados de la asignación.
Una vez asignados los datos de origen, seleccione Cerrar.
Aparece el paso Programación , que le permite configurar una programación de ingestión para ingestar automáticamente los datos de origen seleccionados mediante las asignaciones configuradas. La siguiente tabla describe los diferentes campos configurables para la programación:
Campo | Descripción |
---|---|
Frecuencia | Las frecuencias seleccionables incluyen Once , Minute , Hour , Day y Week . |
Intervalo | Un entero que establece el intervalo para la frecuencia seleccionada. |
Tiempo de inicio | Marca de hora UTC que indica cuándo se produce la primera ingestión. |
Rellenar | Un valor booleano que determina qué datos se ingieren inicialmente. Si Rellenar está activado, todos los archivos actuales de la ruta especificada se ingerirán durante la primera ingestión programada. Si Rellenar está desactivado, solo se ingerirán los archivos que se carguen entre la primera ejecución de la ingesta y el tiempo de inicio. Los archivos cargados antes de la hora de inicio no se ingieren. |
Columna delta | Una opción con un conjunto filtrado de campos de esquema de origen de tipo, fecha u hora. Este campo se utiliza para diferenciar entre datos nuevos y existentes. Los datos incrementales se ingieren según la marca de tiempo de la columna seleccionada. |
Los flujos de datos están diseñados para transferir datos automáticamente en forma programada. Inicio seleccionando la frecuencia de ingestión. A continuación, configure el intervalo para designar el período entre dos ejecuciones de flujo. El valor del intervalo debe ser un entero distinto de cero y debe establecerse en bueno o igual a 15.
Para establecer la hora de inicio para la ingestión, ajuste la fecha y la hora que se muestran en el cuadro de hora del inicio. También puede seleccionar el icono de calendario para editar el valor de tiempo del inicio. La hora de inicio debe ser buena o igual a la hora UTC actual.
Seleccione Cargar datos incrementales por para asignar la columna delta. Este campo ofrece una distinción entre los datos nuevos y los existentes.
Para configurar la ingestión de una sola vez, seleccione la flecha desplegable de frecuencia y seleccione Una vez.
El intervalo y el relleno no son visibles durante una ingestión única.
Una vez que haya proporcionado los valores adecuados a la programación, seleccione Siguiente.
Aparece el paso de detalles de flujo de datos, que le permite asignar un nombre y una breve descripción del nuevo flujo de datos.
Durante este proceso, también puede activar los diagnósticos de ingestión parcial y de error. La activación de la ingestión parcial permite ingestar datos que contengan errores hasta un determinado umbral. Una vez habilitada la inserción parcial , arrastre el dial de umbral de error % para ajustar el umbral de error del lote. Como alternativa, puede ajustar manualmente el umbral seleccionando el cuadro de entrada. Para obtener más información, consulte la información general sobre la ingestión parcial de lotes.
Proporcione valores para el flujo de datos y seleccione Siguiente.
Aparece el paso Revisar , que le permite revisar el nuevo flujo de datos antes de crearlo. Los detalles se agrupan en las siguientes categorías:
Una vez que haya revisado el flujo de datos, haga clic en Finalizar y permita que se cree el flujo de datos.
Una vez creado el flujo de datos, puede monitorear los datos que se están ingeriendo a través de él para ver información sobre tasas de ingestión, éxito y errores. Para obtener más información sobre cómo supervisar el flujo de datos, consulte el tutorial sobre la supervisión de cuentas y flujos de datos en la interfaz de usuario.
Puede eliminar flujos de datos que ya no sean necesarios o que se hayan creado incorrectamente mediante la función Eliminar disponible en el espacio de trabajo Flujos de datos. Para obtener más información sobre cómo eliminar flujos de datos, consulte el tutorial sobre la eliminación de flujos de datos en la interfaz de usuario.
Siguiendo este tutorial, ha creado correctamente un flujo de datos para incorporar datos de comercio electrónico y ha adquirido una perspectiva sobre la supervisión de conjuntos de datos. Los datos entrantes ahora pueden ser utilizados por servicios Platform descendentes como Real-time Customer Profile y Data Science Workspace. Consulte los siguientes documentos para obtener más información: