AEM Cómo analizar problemas críticos comunes de la

AEM Obtenga información sobre los problemas críticos más comunes y cómo analizarlos.

Descripción description

Entorno

Adobe Experience Manager (AEM)

Problema/Síntomas

AEM En este artículo se describen los problemas críticos más comunes y cómo analizarlos.

  • Rendimiento de AEM Sites
  • Rendimiento de AEM Assets
  • Problemas de memoria
  • Problemas de indexación
  • Problemas de replicación
  • Problemas de corrupción de TarMK

Resolución resolution

Problemas de rendimiento de AEM Sites

Síntomas de un problema de rendimiento

  1. Carga lenta de páginas
  2. Creación o edición lenta de páginas
  3. AEM Los tiempos de respuesta de la son lentos
  4. AEM no está respondiendo a algunas solicitudes.
  5. AEM El inicio de sesión de request.log de muestra tiempos de respuesta lentos.

Qué causa problemas de rendimiento

  1. Contención de subprocesos: solicitudes de larga ejecución como búsquedas lentas, trabajos en segundo plano con gran capacidad de escritura, movimiento de ramas completas de contenido del sitio, etc.
  2. Alta utilización de CPU
  3. Solicitudes costosas, como búsquedas costosas o código de aplicación ineficiente, componentes, etc.
  4. Falta de mantenimiento adecuado
  5. Caché de Dispatcher insuficiente
  6. Falta de CDN
  7. Falta de almacenamiento en caché del explorador
  8. Se han cargado demasiados scripts en la página y se han cargado en la parte superior de la misma
  9. CSS cargado en toda la página en lugar de en el encabezado del HTML
  10. Tamaño de servidor insuficiente o arquitectura incorrecta
  11. Problemas de memoria (ver más abajo)

Cómo analizar el problema de rendimiento

  1. Capturar una serie de volcados de subprocesos y analizarlos.

  2. AEM AEM Compruebe en el nivel del sistema operativo si el proceso de java de está causando un uso elevado de la CPU: Si está causando un uso elevado de la CPU, ejecute la herramienta de generación de perfiles predeterminada durante unos minutos y analice el resultado.

    • Linux: utilice el comando top para comprobar el uso de la CPU.
    • Ventana: usar el Administrador de tareas de Windows
  3. Analice el archivo request.log en busca de solicitudes lentas.

  4. Revise los procedimientos de mantenimiento del sistema. AEM AEM Consulte este artículo para obtener más información sobre el mantenimiento de la y asegurarse de que está realizando el mantenimiento adecuado de los siguientes elementos:

    • Limpieza de revisión (solo de MongoMK y Database DocumentNodeStore): diaria o más frecuente
    • Compactación Tar sin conexión (solo TarMK): quincenal
    • Recopilación de residuos del almacén de datos (sistemas con FileDataStore o S3 DataStore solamente): semanal
    • Purga del flujo de trabajo: semanal
    • Depuración de versión: semanal
    • Purga de AuditLog: semanal
  5. AEM Revise las estrategias de almacenamiento en caché implementadas en nivel de Dispatcher de.

  6. Revisa el almacenamiento en caché de tu sitio.

  7. Utilice herramientas de análisis del sitio del lado del cliente, como la característica Auditorías en el panel Herramientas para desarrolladores del explorador Google Chrome. Estas herramientas le ofrecerán recomendaciones sobre las mejoras de rendimiento del lado del cliente.

Soluciones a problemas de rendimiento comunes

Problemas de rendimiento de Assets

Síntomas de un problema de rendimiento de Assets

  • Cargas de archivos lentas en /assets.html o en la interfaz de usuario /damadmin
  • Las miniaturas tardan demasiado en generarse
  • Las operaciones de Assets, como mover, eliminar, editar y actualizar metadatos, tardan demasiado tiempo

Qué causa problemas con el rendimiento de Assets

  • Falta de mantenimiento adecuado
  • Últimos paquetes de correcciones no aplicados
  • Optimizaciones no aplicadas
  • Tamaño de servidor no adecuado para la carga del usuario

Cómo analizar el problema de rendimiento de Assets

Soluciones a problemas comunes de rendimiento de Assets

Problemas de memoria

Síntomas de un problema de memoria

  • AEM se produce un bloqueo aleatorio en los registros y se observa OutOfMemoryError
  • AEM El tiempo se vuelve más lento y, finalmente, se bloquea
  • AEM no responde la

Diagnóstico de un problema de memoria

  • Busque en los archivos de registro OutOfMemoryError; si encuentra alguna coincidencia, tendrá un problema de memoria

  • Revise la pantalla http://aem-host:port/system/console/memoryusage

    Si el uso de Old Generation (JDK 7 y versiones anteriores) o Tenured Generation (JDK 8 o posteriores) es alto, esto podría ser una señal de un problema de utilización de memoria. Haga clic en "Ejecutar recolector de elementos no utilizados" para solicitar a JVM que ejecute una recolección de elementos no utilizados completa. Si la alta utilización de la pila permanece alta después de solicitar GC, es probable que haya un problema. AEM En una instancia de con el almacenamiento Tar de Oak, si el uso de duración es superior a 3 GB, puede haber un problema. La alta utilización de la pila en un sistema con almacenamiento Mongo podría deberse a la configuración de la caché en memoria.

  • Tome volcados de hilos y la salida superior y realice análisis de hilos. Compruebe si los hilos que causan un alto uso de la CPU son hilos nativos de recolección de basura de JVM. Si el hilo que utiliza la mayor parte del tiempo de CPU es el "hilo VM" o cualquier hilo de recolección de basura, es probable que haya un problema de memoria.

Qué causa problemas de memoria

  • Pérdida de memoria de la aplicación Java
  • El Finalizador de Java se acumula debido a un uso incorrecto de la finalización en el código personalizado
  • Configuración de pila máxima insuficiente

Cómo analizar la causa del problema de memoria

Consulte este artículo para obtener detalles sobre cómo capturar un volcado de la pila.

La mejor manera de identificar la causa de un problema de memoria es analizar un volcado de la pila.

Una vez que haya capturado un archivo de volcado de la pila, ábralo en la herramienta Eclipse MAT o Analizador de memoria IBM. En Eclipse MAT, ejecute el informe Sospechosos de fuga y abra la vista "Detalles del hilo" para ver las posibles causas del problema de memoria.

Soluciones a problemas comunes de memoria

  • Optimice el código de su aplicación para utilizar menos memoria si observa pausas largas de recolección de elementos no utilizados. La mayoría de los problemas de recolección de basura se pueden resolver mejor optimizando la aplicación en lugar de ajustar la JVM.
  • Si ya ha optimizado la aplicación y aún experimenta pausas de GC largas, céntrese en ajustar la JVM.

AEM Problema de indexación de

Síntomas de problemas de indexación

AEM Los siguientes son signos de un problema con la indexación de las versiones de Oak y de la:

  • Los resultados de la búsqueda han quedado obsoletos durante más de 10 minutos
  • Faltan resultados de búsqueda
  • Los errores se devuelven en la interfaz de usuario o en los registros durante la búsqueda a través de la interfaz de usuario del sitio, la búsqueda del Generador de consultas o la ejecución de consultas JCR

Diagnóstico de un problema de indización

Para ver si la indexación asíncrona es lenta o falla, haga lo siguiente:

  1. AEM AEM Abra estas direcciones URL en la instancia de la para ver las estadísticas del indexador asíncrono: http://aemhost:port/system/console/jmx/org.apache.jackrabbit.oak%3Aname%3Dasync%2Ctype%3DIndexStats http://aemhost:port/system/console/jmx/org.apache.jackrabbit.oak%3Aname%3Dfulltext-async%2Ctype%3DIndexStats : Esta URL solo se aplica a la versión 6.2 y posteriores de la

  2. En cada una de estas páginas, compruebe estos campos:

    Fallo desde: esto indica cuándo comenzó a fallar la indexación por primera vez.

    LastError: este es el seguimiento de pila que muestra las causas de los errores de indización. Si está vacío, la indexación no falla.

    LastErrorTime: esto indica la última vez que la indización arrojó el error.

    LastIndexedTime: si la fecha y la hora de este campo tienen más de 5 minutos, la indexación es demasiado lenta.

Qué causa problemas con la indexación

  • Mantenimiento incorrecto o fallo al realizar el mantenimiento, como la recolección de basura de revisión, la depuración del flujo de trabajo, la depuración de auditoría, la depuración de la versión, etc.
  • Faltan segmentos o están dañados en el almacenamiento Tar
  • Corrupción de revisión en un entorno agrupado (DocumentNodeStore - Mongo o Base de datos)
  • Problema con la topología de clúster en un entorno en clúster

Cómo analizar la causa de los problemas de indización

  • Consulte este artículo para analizar y corregir problemas de indización

Problemas de replicación

Síntomas de problemas de replicación

  • Las solicitudes de Publish se están poniendo en cola en la cola del agente de replicación
  • El contenido publicado no se muestra en el servidor de publicación
  • Impacto en el rendimiento del sistema

Qué causa los problemas de replicación:

  • El agente de replicación está mal configurado y no puede conectarse al agente de publicación
  • Hay un error en el momento de la replicación que hace que la cola de replicación se bloquee
  • El sistema es lento y las réplicas se procesan lentamente
  • La replicación se produce como parte de un flujo de trabajo personalizado y el problema es el procesamiento del flujo de trabajo.

Cómo analizar los problemas de replicación:

  1. Comprobar el estado de la cola de replicación status:

    Activo: cuando los elementos se están procesando.

    Inactivo: cuando la cola está vacía.

    Bloqueado: cuando los elementos están en cola, pero no se pueden procesar; por ejemplo, cuando el agente señala a un host inactivo o inexistente.

  2. Revise las configuraciones de replicación si el servidor está clonado o si el agente se ha configurado recientemente. Para obtener más información, vea aquí.

  3. Revise los registros del agente de replicación en http://host:port/etc/replication/agents.author/AgentName.log.html#end. AEM Si no puede identificar ningún elemento, recopile este registro y preséntelo al servicio de asistencia técnica de la.

  4. AEM Revise el error.log del servidor de AEMinstall/crx-quickstart/logs; Si no puede identificar ningún elemento, recopile este registro y preséntelo para que lo admita el servicio de soporte técnico de la.

  5. Si la cola de replicación está en estado "inactivo" y no se aplica nada de lo anterior, en este caso el problema se debe probablemente a los flujos de trabajo. Si los flujos de trabajo no se procesan, el elemento de replicación nunca llega a la cola de replicación. Para monitorizar el estado de los flujos de trabajo, puede consultar el panel de flujos de trabajo para comprobar el número de instancias de flujo de trabajo en ejecución. Puede leer acerca de la administración de flujos de trabajo aquí.

  6. Las replicaciones se ralentizan cuando el sistema está bajo una carga alta o experimenta otros problemas de rendimiento.

Solución a problemas comunes de replicación:

  1. Revisar los problemas de cola de replicación.
  2. Si el problema se debe a que los flujos de trabajo no se ejecutan correctamente, puede revisar las sugerencias de procesamiento del flujo de trabajo simultáneas.

Problemas de corrupción de TarMK

Síntomas de corrupción de TarMK

  • La instancia no funciona después de la compactación sin conexión.
  • Instancia atascada en el estado Inicio en curso.
  • Archivos de registro o informe de salida de comando de compactación SegmentNotFoundException.

Qué causa problemas de corrupción

  • El segmento se elimina mediante una intervención manual (por ejemplo, rm -rf ).
  • El segmento se elimina mediante la recolección de basura de revisiones o no se puede encontrar el segmento debido a algún error en el código.
  • El segmento no se puede encontrar debido a algún error en el código.
  • Varias tareas de mantenimiento no se realizan a tiempo, lo que conduce al crecimiento del repositorio y a un espacio en disco bajo.
  • AEM Detener el proceso de Java eliminándolo por la fuerza.

Diagnóstico de problemas de corrupción del repositorio:

  • Revise el archivo error.log y compruebe si hay SegmentNotFoundException o IllegalArgument Exception.
  • Para determinar si un segmento se ha eliminado mediante la recolección de basura de revisiones, compruebe el resultado del registrador org.apache.jackrabbit.oak.plugins.segment.file.TarReader-GC (habilitar registro de depuración). Ese registrador registra los ID de segmento de todos los segmentos eliminados por la fase de limpieza. Solo cuando el ID del segmento infractor aparece en la salida de ese registrador, la recolección de basura de revisiones es la causa de la excepción.
  • En caso de daños en el almacén de datos externo, busque en el archivo de registro todas las ocurrencias del error Error al obtener InputStream para blobId. AEM Este error significa que faltan archivos en el directorio del almacén de datos de la.

Solución para reparar problemas de daños:

  • Determine la última revisión buena conocida del almacén de segmentos usando el modo de ejecución check de oak-run. Revierta manualmente el almacén de segmentos corrupto a su última revisión buena. Esta operación revertirá el repositorio de Oak a un estado anterior en el tiempo. Debe realizar una copia de seguridad completa del repositorio antes de realizar esta operación.

    • Para realizar la comprobación y restauración, siga los pasos mencionados en este artículo.
    • Si la comprobación falla con ConsistencyChecker - No se encontraron buenas revisiones, implemente los pasos de la parte B de este artículo.
  • Si no utiliza un almacén de datos, utilice un archivo externo, S3 o un almacén de datos de Azure, en lugar del almacén de segmentos predeterminado.

    • El uso de un almacén de datos proporciona un mejor rendimiento.
    • Migre la instancia a una con un almacén de datos usando crx2oak.
  • Aplique el paquete de servicio y el paquete de correcciones acumulativas más recientes, así como el paquete de correcciones acumulativas de Oak.

recommendation-more-help
3d58f420-19b5-47a0-a122-5c9dab55ec7f