Monitorización de flujos de datos para fuentes de flujo en la IU

Este tutorial trata los pasos para monitorizar los flujos de datos para las fuentes de flujo continuo mediante Fuentes workspace.

Introducción

Este tutorial requiere una comprensión práctica de los siguientes componentes de Adobe Experience Platform:

  • Flujos de datos: los flujos de datos son una representación de los trabajos de datos que mueven datos a través de Platform. Los flujos de datos se configuran en diferentes servicios, lo que ayuda a mover datos de los conectores de origen a los conjuntos de datos de destino, a Identity y Profile, y a Destinations.
    • Ejecuciones de flujo de datos: Las ejecuciones de flujo de datos son los trabajos programados recurrentes en función de la configuración de frecuencia de los flujos de datos seleccionados.
  • Fuentes: Experience Platform permite la ingesta de datos desde varias fuentes y, al mismo tiempo, le ofrece la capacidad de estructurar, etiquetar y mejorar los datos entrantes mediante los servicios de Platform.
  • Zonas protegidas: El Experience Platform proporciona entornos limitados virtuales que dividen una sola instancia de Platform en entornos virtuales independientes para ayudar a desarrollar y evolucionar aplicaciones de experiencia digital.

Monitorización de flujos de datos para fuentes de streaming

En la IU de Platform, seleccione Fuentes desde la barra de navegación izquierda para acceder a Fuentes workspace. El Catálogo La pantalla muestra una variedad de fuentes para las que puede crear una cuenta con.

Para ver los flujos de datos existentes para las fuentes de flujo continuo, seleccione Flujos de datos desde el encabezado superior.

catalogar

El Flujos de datos Esta página contiene una lista de todos los flujos de datos existentes en su organización, incluida la información sobre sus datos de origen, el nombre de la cuenta y el estado de ejecución del flujo de datos.

Seleccione el nombre del flujo de datos que desea ver.

flujos de datos

La siguiente tabla contiene más información sobre los estados de ejecución del flujo de datos:

Estado
Descripción
Completado
El Completed El estado indica que todos los registros de la ejecución del flujo de datos correspondiente se procesaron dentro del período de una hora. A Completed el estado aún puede contener errores en las ejecuciones del flujo de datos.
Correcto
El Success El estado indica que todos los registros de la ejecución del flujo de datos correspondiente se procesaron dentro del período de una hora y que no se encontraron errores durante la ejecución del flujo de datos.
Procesamiento
El Processing El estado indica que un flujo de datos aún no está activo. Este estado suele encontrarse inmediatamente después de crear un nuevo flujo de datos.
Error
El Error El estado indica que el proceso de activación de un flujo de datos se ha interrumpido.
Sin ejecuciones
El No runs El estado indica que se creó el flujo de datos, pero que no se iniciaron ejecuciones de flujo de datos.

El Actividad de flujo de datos Esta página muestra información específica sobre el flujo de datos de streaming. El titular superior contiene el número acumulado de registros ingeridos y registros fallidos para todas las ejecuciones de flujo de datos de flujo continuo en el intervalo de fechas seleccionado.

dataflow-activity

De forma predeterminada, los datos mostrados contienen tasas de ingesta de los últimos siete días. Seleccionar Últimos 7 días para ajustar el lapso de tiempo de los registros mostrados.

Aparece una ventana emergente de calendario, que proporciona opciones para marcos de tiempo de ingesta alternativos. Puede configurar el lapso de tiempo de ejecución del flujo de datos para ver las ejecuciones de flujo de los siete días anteriores o de los últimos 30 días. Como alternativa, puede configurar el calendario interactivo para establecer un lapso de tiempo personalizado de su elección. Cuando termine, seleccione Aplicar.

calendario

La mitad inferior de la página muestra información sobre el número de registros recibidos, ingeridos y fallidos, por ejecución de flujo. Cada ejecución de flujo se registra dentro de un período de tiempo por hora.

de flujo de datos

Métricas de ejecución de flujo de datos dataflow-run-metrics

Cada ejecución de flujo de datos individual muestra los siguientes detalles:

  • Inicio de ejecución de flujo de datos: la hora a la que se inició la ejecución del flujo de datos.
  • Tiempo de procesamiento: Cantidad de tiempo que tardó el flujo de datos en procesarse.
  • Registros recibidos: El número total de registros recibidos en el flujo de datos desde un conector de origen.
  • Registros ingeridos: el recuento total de registros ingeridos en Data Lake.
  • Registros con advertencias: El recuento total de registros con advertencias que se ingirieron. Todos los errores de transformación del asignador se registran como advertencias y las filas que se ingieren parcialmente se etiquetan como success con una advertencia. Nota: La compatibilidad con la ingesta de registros con advertencias solo está disponible para las fuentes de flujo continuo.
  • Error de registros: el número de registros que no se ingirieron en Data Lake debido a errores en los datos.
  • Tasa de ingesta: la tasa de éxito de los registros ingeridos en Data Lake. Esta métrica se aplica cuando Ingesta parcial está activada.
  • Estado: Representa el estado en el que se encuentra el flujo de datos: Completado o Procesando. Completado significa que todos los registros de la ejecución del flujo de datos correspondiente se procesaron dentro del período de una hora. Procesando significa que la ejecución del flujo de datos aún no ha finalizado.

El Resumen de ejecución de flujo de datos Esta página contiene información adicional sobre el flujo de datos, como el ID de ejecución del flujo de datos correspondiente, el conjunto de datos de destino y el ID de organización.

Una ejecución de flujo con errores también contiene el Errores de ejecución de flujo de datos , que muestra el error concreto que provocó el error de la ejecución, así como el recuento total de registros que fallaron.

dataflow-run-overview

Visualización de registros con advertencias warnings

Registros con advertencias muestra una lista de las advertencias de transformación del asignador que se produjeron durante la ejecución del flujo. Las filas que se incorporan parcialmente se consideran correctas y se anexan con advertencias si se encuentran errores de transformación del asignador.

De forma predeterminada, todos los errores de transformación del asignador se consideran advertencias, excepto si son alguno de los siguientes:

  • Errores de sintaxis
  • Referencias a atributos que no existen
  • No coinciden los tipos de datos XDM

Para ver los diagnósticos de error, seleccione Previsualizar diagnósticos de error.

records-with-warning

El Previsualización de diagnósticos de error Esta ventana permite previsualizar hasta 100 errores o advertencias relacionados con la ejecución del flujo de datos. Desde aquí, también puede descargar el manifiesto de error de ingesta para obtener más información, utilizando Data Access API.

diagnósticos

Pasos siguientes

Al seguir este tutorial, ha utilizado correctamente la variable Fuentes workspace para monitorizar los flujos de datos de streaming e identificar los errores que llevaron a errores en los flujos de datos. Consulte los siguientes documentos para obtener más información:

recommendation-more-help
337b99bb-92fb-42ae-b6b7-c7042161d089