AEM Cómo analizar problemas críticos comunes de la
AEM Obtenga información sobre los problemas críticos más comunes y cómo analizarlos.
Descripción
Entorno
Adobe Experience Manager (AEM)
Problema
AEM En este artículo se describen los problemas críticos más comunes y cómo analizarlos.
- Rendimiento de AEM Sites
- Rendimiento de AEM Assets
- Problemas de memoria
- Problemas de indexación
- Problemas de replicación
- Problemas de corrupción de TarMK
Resolución
Problemas de rendimiento de AEM Sites
Síntomas de un problema de rendimiento
- Carga lenta de páginas
- Creación o edición lenta de páginas
- AEM Los tiempos de respuesta de la son lentos
- AEM no responde a algunas solicitudes de
- AEM El inicio de sesión de request.log de muestra tiempos de respuesta lentos.
Qué causa los problemas de rendimiento
- Contención de subprocesos: solicitudes de larga ejecución como búsquedas lentas, trabajos en segundo plano con gran capacidad de escritura, movimiento de ramas completas de contenido del sitio, etc.
- Alta utilización de CPU
- Solicitudes costosas, como búsquedas costosas o código de aplicación ineficiente, componentes, etc.
- Falta de mantenimiento adecuado
- Caché de Dispatcher insuficiente
- Falta de CDN
- Falta de almacenamiento en caché del explorador
- Demasiados scripts cargados en la página y cargados en la parte superior de la página
- CSS cargado en toda la página en lugar de en el encabezado del HTML
- Tamaño de servidor insuficiente o arquitectura incorrecta
- Problemas de memoria (ver más abajo)
Cómo analizar el problema de rendimiento
- Capture una serie de volcados de hilos y analizarlos.
- AEM AEM Compruebe en el nivel del sistema operativo si el proceso de java de está causando un uso elevado de la CPU: Si está causando un uso elevado de la CPU, ejecute la herramienta de generación de perfiles predeterminada durante unos minutos y analice el resultado.
- Linux: utilice el comando top para comprobar el uso de la CPU.
- Ventana: usar el Administrador de tareas de Windows
- Analice el archivo request.log para detectar solicitudes lentas.
- Revise los procedimientos de mantenimiento del sistema. Ver esto artículo AEM AEM para obtener más información sobre el mantenimiento de la y asegurarse de que realiza el mantenimiento adecuado, incluyendo lo siguiente:
- Limpieza de revisión (solo de MongoMK y Database DocumentNodeStore): diaria o más frecuente
- Compactación Tar sin conexión (solo TarMK): quincenal
- Recopilación de residuos del almacén de datos (sistemas con FileDataStore o S3 DataStore solamente): semanal
- Purga del flujo de trabajo: semanal
- Depuración de versión: semanal
- Purga de AuditLog: semanal
- Revise las estrategias de almacenamiento en caché implementadas en AEM nivel de Dispatcher.
- Revise el de su sitio almacenamiento en caché.
- Utilice herramientas de análisis del lado del cliente como Auditorías función en el navegador Google Chrome Herramientas para desarrolladores panel. Estas herramientas le ofrecerán recomendaciones sobre las mejoras de rendimiento del lado del cliente.
Soluciones a problemas de rendimiento comunes
Problemas de rendimiento de recursos
Síntomas de un problema de rendimiento de Assets
- Cargas de archivos lentas en /assets.html o en la interfaz de usuario /damadmin
- Las miniaturas tardan demasiado en generarse
- Las operaciones con recursos, como mover, eliminar, editar y actualizar metadatos, tardan demasiado tiempo
¿Qué causa problemas con el rendimiento de los recursos?
- Falta de mantenimiento adecuado
- Últimos paquetes de correcciones no aplicados
- Optimizaciones no aplicadas
- Tamaño de servidor no adecuado para la carga del usuario
Cómo analizar el problema de rendimiento de Assets
Soluciones a problemas comunes de rendimiento de Assets
Problemas de memoria
Síntomas de un problema de memoria
- AEM se produce un bloqueo aleatorio en los registros y se observa OutOfMemoryError
- AEM El tiempo se vuelve más lento y, finalmente, se bloquea
- AEM no responde la
Diagnóstico de un problema de memoria
-
Busque en los archivos de registro OutOfMemoryError; si encuentra alguna coincidencia, tendrá un problema de memoria
-
Consulte http://aem-host:puerto pantalla /system/console/memoryusage
Si el uso de Old Generation (JDK 7 y versiones anteriores) o Tenured Generation (JDK 8 o posteriores) es alto, esto podría ser una señal de un problema de utilización de memoria. Haga clic en "Ejecutar recolector de elementos no utilizados" para solicitar a JVM que ejecute una recolección de elementos no utilizados completa. Si la alta utilización de la pila permanece alta después de solicitar GC, es probable que haya un problema. AEM En una instancia de con el almacenamiento Oak Tar, si el uso de duración es superior a 3 GB, puede haber un problema. La alta utilización de la pila en un sistema con almacenamiento Mongo podría deberse a la configuración de la caché en memoria.
-
Tomar volcados de hilos y salida superior y realizar análisis de subprocesos. Compruebe si los hilos que causan un alto uso de la CPU son hilos nativos de recolección de basura de JVM. Si el hilo que utiliza la mayor parte del tiempo de CPU es el "hilo VM" o cualquier hilo de recolección de basura, es probable que haya un problema de memoria.
Qué causa problemas de memoria
- Pérdida de memoria de la aplicación Java
- El Finalizador de Java se acumula debido a un uso incorrecto de la finalización en el código personalizado
- Configuración de pila máxima insuficiente
Cómo analizar la causa del problema de memoria
Consulte este artículo para obtener más información sobre cómo capturar un volcado de la pila.
La mejor manera de identificar la causa de un problema de memoria es analizar un volcado de la pila.
Cuando haya capturado un archivo de volcado de la pila, ábralo en Eclipse MAT o Analizador de memoria IBM herramienta. En Eclipse MAT, ejecute el informe Sospechosos de fuga y abra la vista "Detalles del hilo" para ver las posibles causas del problema de memoria.
Soluciones a problemas comunes de memoria
- Optimice el código de su aplicación para utilizar menos memoria si observa pausas largas de recolección de elementos no utilizados. La mayoría de los problemas de recolección de basura se pueden resolver mejor optimizando la aplicación en lugar de ajustar la JVM.
- Si ya ha optimizado la aplicación y aún experimenta pausas de GC largas, enfoque en el ajuste de JVM.
AEM Problema de indexación de
Síntomas de problemas de indexación
AEM Los siguientes son signos de un problema con la indexación de Oak/:
- Los resultados de la búsqueda han quedado obsoletos durante más de 10 minutos
- Faltan resultados de búsqueda
- Los errores se devuelven en la interfaz de usuario o en los registros durante la búsqueda a través de la interfaz de usuario del sitio, la búsqueda del Generador de consultas o la ejecución de consultas JCR
Diagnóstico de un problema de indexación
Para ver si la indexación asíncrona es lenta o falla, haga lo siguiente:
-
AEM AEM Abra estas direcciones URL en la instancia de para ver las estadísticas del indizador asíncrono: http://aemhost:port/system/console/jmx/org.apache.jackrabbit.oak%3Aname%3Dasync%2Ctype%3DIndexStats http://aemhost:port/system/console/jmx/org.apache.jackrabbit.oak%3Aname%3Dfulltext-async%2Ctype%3DIndexStats - This La dirección URL solo se aplica a la versión 6.2 y posteriores de la versión de
-
En cada una de estas páginas, compruebe estos campos:
FailingSince - Esto indica cuándo comenzó a fallar la indexación por primera vez.
LastError - Este es el seguimiento de pila que muestra qué está causando que la indexación falle. Si está vacío, la indexación no falla.
LastErrorTime - Esto indica la última vez que la indexación arrojó el error.
LastIndexedTime : Si la fecha y la hora de este campo tienen más de 5 minutos, la indexación se está ejecutando demasiado lenta.
Qué causa los problemas con la indexación
- Mantenimiento incorrecto o fallo al realizar el mantenimiento, como la recolección de basura de revisión, la depuración del flujo de trabajo, la depuración de auditoría, la depuración de la versión, etc.
- Faltan segmentos o están dañados en el almacenamiento Tar
- Corrupción de revisión en un entorno agrupado (DocumentNodeStore - Mongo o Base de datos)
- Problema con la topología de clúster en un entorno en clúster
Cómo analizar la causa de los problemas de indexación
- Consulte este artículo para analizar y corregir problemas de indexación
Problemas de replicación
Síntomas de problemas de replicación
- Las solicitudes de publicación se están poniendo en la cola del agente de replicación
- El contenido publicado no se muestra en el servidor de publicación
- Impacto en el rendimiento del sistema
Qué causa los problemas de replicación:
- El agente de replicación está mal configurado y no puede conectarse al agente de publicación
- Hay un error en el momento de la replicación que hace que la cola de replicación se bloquee
- El sistema es lento y las réplicas se procesan lentamente
- La replicación se produce como parte de un flujo de trabajo personalizado y el problema es el procesamiento del flujo de trabajo.
Cómo analizar los problemas de replicación:
-
Compruebe la cola de replicación status:
Activo: cuando se están procesando artículos.
Inactivo: cuando la cola está vacía.
Bloqueado: cuando los elementos están en cola, pero no se pueden procesar; por ejemplo, cuando el agente señala a un host que está inactivo o que no existe.
-
Revise las configuraciones de replicación si el servidor está clonado o si el agente se ha configurado recientemente. Para obtener más información, consulte aquí.
-
Revise los registros del agente de replicación en http://host:port/etc/replication/agents.author/AgentName.log.html#end. AEM Si no puede identificar ningún elemento, recopile este registro y preséntelo al servicio de asistencia técnica de la.
-
Revise el error.log del servidor desde AEMinstall/crx-quickstart/logsAEM ; Si no puede identificar ningún elemento, recopile este registro y preséntelo al servicio de asistencia técnica de la.
-
Si la cola de replicación está en estado "inactivo" y no se aplica nada de lo anterior, en este caso el problema se debe probablemente a los flujos de trabajo. Si los flujos de trabajo no se procesan, el elemento de replicación nunca llega a la cola de replicación. Para monitorizar el estado de los flujos de trabajo, puede consultar el panel de flujos de trabajo para comprobar el número de instancias de flujo de trabajo en ejecución. Puede leer más sobre la administración de flujos de trabajo aquí.
-
Las replicaciones se ralentizan cuando el sistema está bajo una carga alta o experimenta otros problemas de rendimiento.
Solución a problemas comunes de replicación:
- Revisar los problemas de cola de replicación.
- Si el problema se debe a que los flujos de trabajo no se ejecutan de forma eficaz, puede revisar los sugerencias de procesamiento de flujo de trabajo.
Problemas de corrupción de TarMK
Síntomas de la corrupción de TarMK
- La instancia no funciona después de la compactación sin conexión.
- Instancia atascada en Inicio en curso estado.
- Archivos de registro o informe de salida del comando de compactación SegmentNotFoundException.
Qué causa los problemas de corrupción
- El segmento se elimina mediante una intervención manual (por ejemplo, rm -rf ).
- El segmento se elimina mediante la recolección de basura de revisiones o no se puede encontrar el segmento debido a algún error en el código.
- El segmento no se puede encontrar debido a algún error en el código.
- Varias tareas de mantenimiento no se realizan a tiempo, lo que conduce al crecimiento del repositorio y a un espacio en disco bajo.
- AEM Detener el proceso de Java eliminándolo por la fuerza.
Diagnóstico de problemas de corrupción del repositorio:
- Revise el archivo error.log y compruebe si hay SegmentNotFoundException o Excepción IllegalArgument.
- Para determinar si un segmento se ha eliminado mediante la recolección de basura de revisiones, compruebe el resultado del registrador org.apache.jackrabbit.oak.plugins.segment.file.TarReader-GC (habilitar registro de depuración). Ese registrador registra los ID de segmento de todos los segmentos eliminados por la fase de limpieza. Solo cuando el ID del segmento infractor aparece en la salida de ese registrador, la recolección de basura de revisiones es la causa de la excepción.
- En caso de que se dañe el almacén de datos externo, busque en el archivo de registro todas las incidencias de error Error al obtener InputStream para blobId. AEM Este error significa que faltan archivos en el directorio del almacén de datos de la.
Solución para reparar problemas de corrupción:
- Determine la última revisión buena conocida del almacén de segmentos utilizando la variable check modo de ejecución de oak-run. Revierta manualmente el almacén de segmentos corrupto a su última revisión buena. Esta operación revertirá el repositorio de Oak a un estado anterior en el tiempo. Debe realizar una copia de seguridad completa del repositorio antes de realizar esta operación.
- Para realizar la comprobación y la restauración, siga los pasos mencionados en este artículo.
- Si la comprobación falla con ConsistencyChecker: no se han encontrado buenas revisiones a continuación, implemente los pasos de la parte B de este artículo.
- Si no utiliza un almacén de datos, utilice un archivo externo, S3 o un almacén de datos de Azure, en lugar del almacén de segmentos predeterminado.
- El uso de un almacén de datos proporciona un mejor rendimiento.
- Migre la instancia a una con un almacén de datos mediante crx2oak.
- Aplique el paquete de servicio y el paquete de correcciones acumulativas más recientes, así como el paquete de correcciones acumulativas de Oak.