Monitorización de flujos de datos para fuentes de flujo en la IU
Este tutorial cubre los pasos para monitorizar los flujos de datos de las fuentes de flujo continuo mediante el espacio de trabajo Sources.
Introducción
Este tutorial requiere una comprensión práctica de los siguientes componentes de Adobe Experience Platform:
- Flujos de datos: los flujos de datos son una representación de los trabajos de datos que mueven datos a través de Platform. Los flujos de datos se configuran en diferentes servicios, lo que ayuda a mover datos de los conectores de origen a los conjuntos de datos de destino, a Identity y Profile, y a Destinations.
- Ejecuciones de flujo de datos: Las ejecuciones de flujo de datos son los trabajos programados recurrentes en función de la configuración de frecuencia de los flujos de datos seleccionados.
- Fuentes: El Experience Platform permite la ingesta de datos de varias fuentes, al tiempo que le ofrece la capacidad de estructurar, etiquetar y mejorar los datos entrantes mediante los servicios de Platform.
- Zonas protegidas: El Experience Platform proporciona zonas protegidas virtuales que dividen una sola instancia de Platform en entornos virtuales independientes para ayudar a desarrollar y evolucionar aplicaciones de experiencia digital.
Monitorización de flujos de datos para fuentes de streaming
En la interfaz de usuario de Platform, seleccione Sources en la barra de navegación izquierda para acceder al área de trabajo Sources. La pantalla Catálogo muestra una variedad de orígenes con los que puede crear una cuenta.
Para ver los flujos de datos existentes para las fuentes de flujo continuo, seleccione Flujos de datos en el encabezado superior.
La página Flujos de datos contiene una lista de todos los flujos de datos existentes en su organización, incluida la información sobre sus datos de origen, el nombre de cuenta y el estado de ejecución del flujo de datos.
Seleccione el nombre del flujo de datos que desea ver.
La siguiente tabla contiene más información sobre los estados de ejecución del flujo de datos:
Completed
indica que todos los registros de la ejecución del flujo de datos correspondiente se procesaron dentro del período de una hora. Un estado Completed
aún puede contener errores en las ejecuciones del flujo de datos.Success
indica que todos los registros de la ejecución del flujo de datos correspondiente se procesaron dentro del período de una hora y que no se encontraron errores durante la ejecución del flujo de datos.Processing
indica que un flujo de datos aún no está activo. Este estado suele encontrarse inmediatamente después de crear un nuevo flujo de datos.Error
indica que el proceso de activación de un flujo de datos se ha interrumpido.No runs
indica que se creó el flujo de datos, pero que no se iniciaron ejecuciones de flujo de datos.La página Actividad de flujo de datos muestra información específica sobre el flujo de datos de streaming. El titular superior contiene el número acumulado de registros ingeridos y registros fallidos para todas las ejecuciones de flujo de datos de flujo continuo en el intervalo de fechas seleccionado.
De forma predeterminada, los datos mostrados contienen tasas de ingesta de los últimos siete días. Seleccione Últimos 7 días para ajustar el lapso de tiempo de los registros mostrados.
Aparece una ventana emergente de calendario, que proporciona opciones para marcos de tiempo de ingesta alternativos. Puede configurar el lapso de tiempo de ejecución del flujo de datos para ver las ejecuciones de flujo de los siete días anteriores o de los últimos 30 días. Como alternativa, puede configurar el calendario interactivo para establecer un lapso de tiempo personalizado de su elección. Cuando termine, seleccione Aplicar.
La mitad inferior de la página muestra información sobre el número de registros recibidos, ingeridos y fallidos, por ejecución de flujo. Cada ejecución de flujo se registra dentro de un período de tiempo por hora.
Métricas de ejecución de flujo de datos dataflow-run-metrics
Cada ejecución de flujo de datos individual muestra los siguientes detalles:
- Inicio de ejecución del flujo de datos: La hora a la que comenzó la ejecución del flujo de datos.
- Tiempo de procesamiento: Cantidad de tiempo que tardó el flujo de datos en procesarse.
- Registros recibidos: El número total de registros recibidos en el flujo de datos desde un conector de origen.
- Registros ingeridos: El recuento total de registros ingeridos en Data Lake.
- Registros con advertencias: El recuento total de registros con advertencias que se ingirieron. Todos los errores de transformación del asignador se registran como advertencias y las filas que se ingieren parcialmente se etiquetan como
success
con una advertencia. Nota: La compatibilidad con la ingesta de registros con advertencias solo está disponible para las fuentes de flujo continuo. - Registros con errores: El número de registros que no se ingerieron en Data Lake debido a errores en los datos.
- Tasa de ingesta: La tasa de éxito de los registros ingeridos en Data Lake. Esta métrica es aplicable cuando Ingesta parcial está habilitada.
- Estado: Representa el estado en el que se encuentra el flujo de datos: Completado o Procesando. Completado significa que todos los registros de la ejecución del flujo de datos correspondiente se procesaron dentro del período de una hora. Procesando significa que la ejecución del flujo de datos aún no ha finalizado.
La página Información general sobre la ejecución del flujo de datos contiene información adicional sobre el flujo de datos, como el ID de ejecución del flujo de datos correspondiente, el conjunto de datos de destino y el ID de organización.
Una ejecución de flujo con errores también contiene el panel Errores de ejecución de flujo de datos, que muestra el error concreto que provocó el error de la ejecución, así como el recuento total de registros que fallaron.
Visualización de registros con advertencias warnings
Registros con advertencias muestra una lista de las advertencias de transformación del asignador que se produjeron durante la ejecución del flujo. Las filas que se incorporan parcialmente se consideran correctas y se anexan con advertencias si se encuentran errores de transformación del asignador.
De forma predeterminada, todos los errores de transformación del asignador se consideran advertencias, excepto si son alguno de los siguientes:
- Errores de sintaxis
- Referencias a atributos que no existen
- No coinciden los tipos de datos XDM
Para ver los diagnósticos de error, seleccione Previsualizar diagnósticos de error.
La ventana de Previsualización de diagnósticos de error le permite obtener una vista previa de hasta 100 errores o advertencias con respecto a la ejecución del flujo de datos. Desde aquí, también puede descargar el manifiesto de error de ingesta para obtener más información, mediante la API Data Access.
Pasos siguientes
Al seguir este tutorial, ha utilizado correctamente el espacio de trabajo Sources para supervisar los flujos de datos de flujo continuo e identificar los errores que provocaban errores en los flujos de datos. Consulte los siguientes documentos para obtener más información: