Limpieza de revisión revision-cleanup
Introducción introduction
Cada actualización del repositorio crea una revisión de contenido. Como resultado, con cada actualización, el tamaño del repositorio aumenta. Las revisiones antiguas deben limpiarse para liberar recursos de disco. Esto es importante para evitar un crecimiento incontrolado del repositorio. Esta funcionalidad de mantenimiento se denomina Limpieza de revisión. Ha estado disponible como una rutina sin conexión desde Adobe Experience Manager AEM () 6.0.
AEM Con la versión 6.3 y superior de la, se ha introducido una versión en línea de esta funcionalidad denominada Limpieza de revisión en línea. AEM AEM En comparación con la Limpieza de revisión sin conexión, en la que la instancia de debe cerrarse, la Limpieza de revisión en línea puede ejecutarse mientras la instancia está en línea. Limpieza de revisión en línea está activada de forma predeterminada y es la forma recomendada de realizar una limpieza de revisión.
Nota: Vea el Vídeo para ver una introducción y cómo usar la Limpieza de revisión en línea.
El proceso de limpieza de revisión consta de tres fases: estimación, compactación y limpieza. La estimación determina si se debe ejecutar la siguiente fase (compactación) o no en función de la cantidad de basura que se pueda recolectar. Durante la fase de compactación, los segmentos y los archivos tar se vuelven a escribir sin tener en cuenta el contenido no utilizado. A continuación, la fase de limpieza elimina los segmentos antiguos, incluida la basura que puedan contener. AEM El modo sin conexión generalmente puede reclamar más espacio porque el modo en línea debe tener en cuenta el conjunto de trabajo de que se dispone para evitar que se recopilen segmentos adicionales.
Para obtener más información sobre Revision Cleanup, consulte los siguientes vínculos:
También puede leer la documentación oficial de Oak.
¿Cuándo utilizar la Limpieza de revisión en línea y cuándo la Limpieza de revisión sin conexión? when-to-use-online-revision-cleanup-as-opposed-to-offline-revision-cleanup
Limpieza de revisión en línea es la forma recomendada de realizar la limpieza de revisión. Limpieza de revisión sin conexión solo debe usarse de forma excepcional, por ejemplo, antes de migrar al nuevo formato de almacenamiento o si el Servicio de atención al cliente de Adobe le solicita que lo haga.
Cómo ejecutar la limpieza de revisión en línea how-to-run-online-revision-cleanup
AEM La Limpieza de revisión en línea está configurada de forma predeterminada para ejecutarse automáticamente una vez al día tanto en instancias de autor como en instancias de Publish de la. Todo lo que debe hacer es definir la ventana de mantenimiento durante un periodo con la menor actividad de usuario. Puede configurar la tarea Limpieza de revisión en línea de la siguiente manera:
-
AEM En la ventana principal de la, vaya a Herramientas - Operaciones - Panel de control - Mantenimiento o dirija su explorador a:
https://serveraddress:serverport/libs/granite/operations/content/maintenance.html
-
Pase el ratón sobre Ventana de mantenimiento diario y haga clic en el icono Configuración.
-
Introduzca los valores deseados (periodicidad, hora de inicio, hora de finalización) y haga clic en Guardar.
Alternativamente, si desea ejecutar la tarea de limpieza de revisión manualmente, puede:
-
Vaya a Herramientas - Operaciones - Panel de control - Mantenimiento o busque directamente
https://serveraddress:serverport/libs/granite/operations/content/maintenance.html
-
Haga clic en Ventana de mantenimiento diario.
-
Pase el ratón sobre el icono Limpieza de revisión.
-
Haga clic en Ejecutar.
Ejecución De La Limpieza De Revisión En Línea Después De La Limpieza De Revisión Sin Conexión running-online-revision-cleanup-after-offline-revision-cleanup
El proceso de limpieza de revisión reclama las revisiones antiguas por generaciones. Esto significa que cada vez que ejecuta la limpieza de revisión se crea una nueva generación y se mantiene en el disco. Sin embargo, hay una diferencia entre los dos tipos de limpieza de revisión: la limpieza de revisión sin conexión mantiene una generación, mientras que la limpieza de revisión en línea mantiene dos generaciones. Por lo tanto, cuando ejecuta la limpieza de revisión en línea después de la limpieza de revisión sin conexión, ocurre lo siguiente:
- Después de la primera ejecución de limpieza de revisión en línea, el tamaño del repositorio se duplica. Esto sucede porque ahora hay dos generaciones que se mantienen en el disco.
- Durante las ejecuciones posteriores, el repositorio crecerá temporalmente mientras se crea la nueva generación y luego se estabilizará de nuevo al tamaño que tenía después de la primera ejecución, a medida que el proceso de limpieza de revisión en línea reclama a la generación anterior.
Además, tenga en cuenta que según el tipo y el número de confirmaciones, cada generación puede variar en tamaño en comparación con la anterior, por lo que el tamaño final puede variar de una ejecución a otra.
Debido a este hecho, se recomienda dimensionar el disco al menos dos o tres veces más grande que el tamaño del repositorio estimado inicialmente.
Modos De Compactación Completa Y De Cola full-and-tail-compaction-modes
AEM 6.5 presenta dos nuevos modos para la fase de compactación del proceso de Limpieza de revisiones en línea:
- El modo compactación completa reescribe todos los segmentos y archivos tar de todo el repositorio. La fase de limpieza posterior puede, por lo tanto, eliminar la cantidad máxima de residuos en el repositorio. Debido a que la compactación completa afecta a todo el repositorio, requiere una cantidad considerable de recursos del sistema y tiempo para completarse. AEM La compactación total corresponde a la fase de compactación de la versión 6.3 de la.
- El modo tail compaction solo reescribe los segmentos y archivos tar más recientes del repositorio. Los segmentos y archivos tar más recientes son los que se han añadido desde la última vez que se ejecutó la compactación completa o de cola. Por lo tanto, la fase de limpieza posterior solo puede eliminar la basura contenida en la parte reciente del repositorio. Debido a que la compactación de cola solo afecta a una parte del repositorio, requiere considerablemente menos recursos del sistema y tiempo para completarla que la compactación completa.
Estos modos de compactación constituyen un equilibrio entre la eficiencia y el consumo de recursos: aunque la compactación de cola es menos eficaz, también tiene menos impacto en el funcionamiento normal del sistema. Por el contrario, la compactación total es más eficaz, pero tiene un mayor impacto en el funcionamiento normal del sistema.
AEM La versión 6.5 también introduce un mecanismo de deduplicación de contenido más eficaz durante la compactación, lo que reduce aún más el espacio en disco del repositorio.
AEM AEM En los dos gráficos que figuran a continuación, se presentan los resultados de las pruebas de laboratorio internas que ilustran la reducción de los tiempos de ejecución promedio y la huella media en disco en 6,5 comparado con la de los discos en 6,3, en comparación con la de los discos en 6,3, en comparación con la de los discos en 6,5, respectivamente.
Cómo configurar la compactación completa y de cola how-to-configure-full-and-tail-compaction
La configuración predeterminada ejecuta la compactación de cola entre semana y la compactación completa los domingos. La configuración predeterminada se puede cambiar usando el nuevo valor de configuración full.gc.days
de RevisionCleanupTask
tarea de mantenimiento.
Al configurar el valor full.gc.days
, la compactación completa se ejecuta durante los días definidos en el valor y la compactación de cola se ejecuta durante los días no definidos en el valor. Por ejemplo, si configura la compactación completa para que se ejecute el domingo, la compactación de cola se ejecuta de lunes a sábado. Por ejemplo, si configura la compactación completa para que se ejecute todos los días de la semana, la compactación de cola no se ejecuta en absoluto.
Además, tenga en cuenta que:
- La compactación de cola es menos efectiva y tiene menos impacto en las operaciones normales del sistema. Por lo tanto, está previsto que se ejecute durante los días laborables.
- La compactación completa es más efectiva, pero también tiene un mayor impacto en las operaciones normales del sistema. Por lo tanto, está previsto que se utilice fuera de los días hábiles.
- Tanto la compactación de cola como la compactación completa deben programarse para ejecutarse durante las horas de menor actividad.
Resolución de problemas troubleshooting
Cuando utilice los nuevos modos de compactación, tenga en cuenta lo siguiente:
- Puede monitorizar la actividad de entrada/salida (E/S), por ejemplo: operaciones de E/S, CPU esperando E/S, tamaño de cola de confirmación. Esto ayuda a determinar si el sistema está enlazado a E/S y si es necesario convertir.
RevisionCleanupTaskHealthCheck
indica el estado general de la Limpieza de revisión en línea. AEM Funciona de la misma manera que en la versión 6.3 de la y no distingue entre compactación total y de cola.- Los mensajes de registro llevan información relevante sobre los modos de compactación. Por ejemplo, cuando se inicia la Limpieza de revisión en línea, los mensajes de registro correspondientes indican el modo de compactación. Además, en algunos casos extremos, el sistema vuelve a la compactación completa cuando estaba programado para ejecutar una compactación de cola y los mensajes de registro indican este cambio. Las siguientes muestras de registro indican el modo de compactación y el cambio de cola a compactación completa:
TarMK GC: running tail compaction
TarMK GC: no base state available, running full compaction instead
Limitaciones conocidas known-limitations
A veces, la alternancia entre los modos de cola y compactación completa retrasa el proceso de limpieza. Más concretamente, el repositorio crecerá después de una compactación completa (se duplica en tamaño). El espacio adicional se recupera en la siguiente compactación de cola, cuando el repositorio cae por debajo del tamaño de compactación precompleta. También deben evitarse las ejecuciones de tareas de mantenimiento paralelas.
Se recomienda cambiar el tamaño del disco al menos dos o tres veces más grande que el tamaño de repositorio estimado inicialmente.
Preguntas más frecuentes sobre Limpieza de revisiones en línea online-revision-cleanup-frequently-asked-questions
AEM Consideraciones de actualización de 6.5 aem-upgrade-considerations
Migración al Segmento de destino de Oak migrating-to-oak-segment-tar
Ejecución de Limpieza de revisión en línea running-online-revision-cleanup
Supervisar limpieza de revisión en línea monitoring-online-revision-cleanup
Solución de problemas de revisión en línea troubleshooting-online-revision-cleanup
Solución De Problemas Según Mensajes De Error troubleshooting-based-on-error-messages
El error.log es detallado si hay incidentes durante el proceso de limpieza de revisión en línea. La siguiente matriz tiene como objetivo explicar los mensajes más comunes y proporcionar posibles soluciones:
Cómo ejecutar la limpieza de revisión sin conexión how-to-run-offline-revision-cleanup
Adobe proporciona una herramienta llamada Oak-run para realizar la limpieza de revisión. Se puede descargar en la siguiente ubicación:
https://repo1.maven.org/maven2/org/apache/jackrabbit/oak-run/
La herramienta es un JAR ejecutable que se puede ejecutar manualmente para compactar el repositorio. El proceso se denomina limpieza de revisión sin conexión porque el repositorio debe cerrarse para ejecutar correctamente la herramienta. Asegúrese de planificar la limpieza de acuerdo con la ventana de mantenimiento.
Para obtener sugerencias sobre cómo aumentar el rendimiento del proceso de limpieza, vea Aumentar el rendimiento de la limpieza de revisiones sin conexión.
-
AEM Asegúrese siempre de tener una copia de seguridad reciente de la instancia de la.
AEM Cierra la puerta
-
(Opcional) Utilice la herramienta para buscar puntos de comprobación antiguos:
code language-xml java -jar oak-run.jar checkpoints install-folder/crx-quickstart/repository/segmentstore
-
(Opcional) A continuación, elimine los puntos de comprobación sin referencia:
code language-xml java -jar oak-run.jar checkpoints install-folder/crx-quickstart/repository/segmentstore rm-unreferenced
-
Ejecute la compactación y espere a que se complete:
code language-xml java -jar -Dsun.arch.data.model=32 oak-run.jar compact install-folder/crx-quickstart/repository/segmentstore
Aumento del rendimiento de la limpieza de revisión sin conexión increasing-the-performance-of-offline-revision-cleanup
La herramienta oak-run introduce varias funciones que pretenden aumentar el rendimiento del proceso de limpieza de revisión y minimizar la ventana de mantenimiento en la medida de lo posible.
La lista incluye varios parámetros de línea de comandos, como se describe a continuación:
-
-mmap. Puede establecer esto como verdadero o falso. Si se establece en true, se utiliza el acceso asignado a la memoria. Si se establece en false, se utiliza el acceso a archivos. Si no se especifica, el acceso asignado a memoria se utiliza en sistemas de 64 bits y el acceso a archivos se utiliza en sistemas de 32 bits. En Windows, el acceso regular a archivos siempre se aplica y esta opción se ignora. Este parámetro ha reemplazado el parámetro -Dtar.memoryMapped.
-
-Dupdate.limit. Define el umbral para el vaciado de una transacción temporal en disco. El valor predeterminado es 10000.
-
-Dcompress-interval. Número de entradas de mapa de compactación que se deben mantener hasta comprimir el mapa actual. El valor predeterminado es 1000000. Debe aumentar este valor a un número aún mayor para obtener un rendimiento más rápido, si hay suficiente memoria disponible. Este parámetro se ha quitado en la versión 1.6 de Oak y no tiene ningún efecto.
-
-Dcompaction-progress-log. El número de nodos compactados que se registran. El valor predeterminado es 150000, lo que significa que los primeros nodos compactados 150000 se registran durante la operación. Utilícelo con el siguiente parámetro documentado a continuación.
-
-Dtar.PersistCompactionMap. Establezca este parámetro en true para utilizar espacio en disco en lugar de memoria de montón para la persistencia de mapa de compactación. Requiere la herramienta oak-run versiones 1.4 y superiores. Para obtener más información, consulte la pregunta 3 en la sección Preguntas más frecuentes sobre la limpieza de revisiones sin conexión. Este parámetro se ha quitado en la versión 1.6 de Oak y no tiene ningún efecto.
-
: forzar. Forzar la compactación e ignorar una versión de almacén de segmentos no coincidente.
--force
, se actualiza el almacén de segmentos a la versión más reciente, lo cual es incompatible con versiones de Oak anteriores. Además, considere que no es posible bajar de categoría. Por lo general, estos parámetros deben utilizarse con precaución y solo si tiene conocimientos sobre cómo utilizarlos.Un ejemplo de los parámetros en uso:
java -Dupdate.limit=10000 -Dcompaction-progress-log=150000 -Dlogback.configurationFile=logback.xml -Xmx8g -jar oak-run-*.jar checkpoints <repository>
Métodos adicionales para activar la limpieza de revisión additional-methods-of-triggering-revision-cleanup
Además de los métodos presentados anteriormente, también puede almacenar en déclencheur el mecanismo de limpieza de revisión mediante la consola JMX de la siguiente manera:
- Abra la consola JMX yendo a http://localhost:4502/system/console/jmx
- Haga clic en el MBean RevisionGarbageCollection.
- En la siguiente ventana, haga clic en startRevisionGC() y luego en Invoke para iniciar el trabajo de recolección de basura de revisión.