Monitorizar flujos de datos para fuentes de transmisión en la interfaz de usuario

Este tutorial trata los pasos para monitorizar los flujos de datos para fuentes de flujo continuo mediante el Fuentes espacio de trabajo.

Primeros pasos

Este tutorial requiere una comprensión práctica de los siguientes componentes de Adobe Experience Platform:

  • Flujos de datos: Los flujos de datos son una representación de los trabajos de datos que mueven los datos a través de Platform. Los flujos de datos se configuran en distintos servicios, lo que ayuda a mover datos de conectores de origen a conjuntos de datos de destino, a Identity y Profiley Destinations.
    • Ejecuciones de flujo de datos: Las ejecuciones de flujo de datos son los trabajos programados recurrentes basados en la configuración de frecuencia de los flujos de datos seleccionados.
  • Fuentes: Experience Platform permite la ingesta de datos de varias fuentes, al mismo tiempo que le ofrece la capacidad de estructurar, etiquetar y mejorar los datos entrantes mediante los servicios de Platform.
  • Sandboxes: Experience Platform proporciona entornos limitados virtuales que dividen una sola instancia de Platform en entornos virtuales independientes para ayudar a desarrollar y desarrollar aplicaciones de experiencia digital.

Monitorización de flujos de datos para fuentes de flujo continuo

En la interfaz de usuario de Platform, seleccione Fuentes en la barra de navegación izquierda para acceder a la Fuentes espacio de trabajo. La variable Catálogo muestra una variedad de fuentes para las que puede crear una cuenta.

Para ver los flujos de datos existentes de las fuentes de flujo continuo, seleccione Flujos de datos en el encabezado superior.

catálogo

La variable Flujos de datos contiene una lista de todos los flujos de datos existentes en su organización, incluida la información sobre sus datos de origen, el nombre de cuenta y el estado de ejecución del flujo de datos.

Seleccione el nombre del flujo de datos que desea ver.

flujos de datos

La siguiente tabla contiene más información sobre los estados de ejecución de flujo de datos:

Estado Descripción
Completado La variable Completed indica que todos los registros de la ejecución de flujo de datos correspondiente se procesaron dentro del período de una hora. A Completed El estado de aún puede contener errores en las ejecuciones de flujo de datos.
Correcto La variable Success indica que todos los registros de la ejecución de flujo de datos correspondiente se procesaron dentro del período de una hora y que no se encontraron errores durante el curso de la ejecución del flujo de datos.
Procesamiento La variable Processing indica que un flujo de datos aún no está activo. Este estado se encuentra a menudo inmediatamente después de crear un nuevo flujo de datos.
Error La variable Error indica que se ha interrumpido el proceso de activación de un flujo de datos.
Sin ejecuciones La variable No runs estado indica que se creó el flujo de datos, pero que no se iniciaron ejecuciones de flujo de datos.

La variable Actividad de flujo de datos muestra información específica sobre el flujo de datos de flujo continuo. El banner superior contiene el número acumulado de registros ingestados y los registros fallidos para todas las ejecuciones de flujo de datos de flujo continuo en el intervalo de fechas seleccionado.

actividad de flujo de datos

De forma predeterminada, los datos mostrados contienen tasas de ingesta de los últimos siete días. Select Últimos 7 días para ajustar el lapso de tiempo de los registros mostrados.

Aparece una ventana emergente de calendario que proporciona opciones para intervalos de tiempo de ingesta alternativos. Puede configurar el intervalo de tiempo de ejecución del flujo de datos para ver las ejecuciones de flujo de los últimos siete días o de los últimos 30 días. Como alternativa, puede configurar el calendario interactivo para establecer un intervalo de tiempo personalizado de su elección. Cuando termine, seleccione Aplicar.

calendario

La mitad inferior de la página muestra información sobre el número de registros recibidos, anidados y fallidos por ejecución de flujo. Cada ejecución de flujo se registra dentro de una ventana por hora.

dataflow-run

Métricas de ejecución de flujo de datos

Cada ejecución de flujo de datos individual muestra los siguientes detalles:

  • Inicio de la ejecución del flujo de datos: Hora a la que comenzó la ejecución del flujo de datos.
  • Tiempo de procesamiento: Cantidad de tiempo que tardó el flujo de datos en procesarse.
  • Registros recibidos: Número total de registros recibidos en el flujo de datos desde un conector de origen.
  • Registros ingestados: El recuento total de registros ingestados en Data Lake.
  • Registros con advertencias: Recuento total de registros con advertencias que se incorporaron. Todos los errores de transformación del asignador se notifican como advertencias y las filas que se incorporan parcialmente se etiquetan como success con una advertencia. Nota: La compatibilidad con la ingesta de registros con advertencias solo está disponible para fuentes de flujo continuo.
  • Registros fallidos: El número de registros que no se incorporaron en Data Lake debido a errores en los datos.
  • Tasa de ingesta: La tasa de éxito de los registros introducidos en Data Lake. Esta métrica es aplicable cuando Ingesta parcial está activada.
  • Estado: Representa el estado en el que se encuentra el flujo de datos: o Completado o Procesamiento. Completado significa que todos los registros de la ejecución del flujo de datos correspondiente se procesaron dentro del período de una hora. Procesamiento significa que la ejecución del flujo de datos aún no ha finalizado.

La variable Resumen de ejecución de flujo de datos contiene información adicional sobre el flujo de datos, como su ID de ejecución de flujo de datos correspondiente, el conjunto de datos de destino y el ID de organización.

Un flujo ejecutado con errores también contiene la variable Errores de ejecución del flujo de datos , que muestra el error en particular que provocó el fallo de la ejecución, así como el recuento total de registros que fallaron.

dataflow-run-overview

Ver registros con advertencias

Registros con advertencias muestra una lista de advertencias de transformación del asignador que se produjeron durante la ejecución del flujo. Las filas parcialmente ingeridas se consideran correctas y se añaden con advertencias si se encuentran errores de transformación del asignador.

De forma predeterminada, todos los errores de transformación del asignador se consideran advertencias, excepto si son cualquiera de los siguientes:

  • Errores de sintaxis
  • Referencias a atributos que no existen
  • Discordancia entre los tipos de datos XDM

Para ver los diagnósticos de error, seleccione Previsualizar diagnósticos de error.

registros con advertencias

La variable Vista previa del diagnóstico de errores permite obtener una vista previa de hasta 100 errores o advertencias relacionados con la ejecución del flujo de datos. Desde aquí también puede descargar el manifiesto de error de ingesta para obtener más información, utilizando la variable Data Access API.

diagnóstico

Pasos siguientes

Al seguir este tutorial, ha utilizado correctamente la variable Fuentes espacio de trabajo para controlar los flujos de datos de flujo continuo e identificar los errores que han producido cualquier flujo de datos fallido. Consulte los siguientes documentos para obtener más información:

En esta página