CRX2Oak es una herramienta diseñada para migrar datos entre diferentes repositorios.
Se puede utilizar para migrar datos de versiones de CQ anteriores basadas en Apache Jackrabbit 2 a Oak, y también se puede utilizar para copiar datos entre repositorios Oak.
Puede descargar la versión más reciente de crx2oak desde el repositorio de Adobe público en esta ubicación:
https://repo.adobe.com/nexus/content/groups/public/com/adobe/granite/crx2oak/
La lista de cambios y correcciones para la versión más reciente se encuentra en las Notas de la versión de CRX2Oak.
Para obtener más información sobre Apache Oak y los conceptos clave de AEM resistencia, consulte Introducción a la plataforma de AEM.
La herramienta se puede utilizar para:
La compatibilidad con la migración de repositorios utilizando Blob Stores externos (comúnmente conocidos como Data Stores) se proporciona en diferentes combinaciones. Una posible ruta de migración es desde un repositorio CRX2 que está usando un FileDataStore
externo a un repositorio Oak usando un S3DataStore
.
El diagrama siguiente ilustra todas las combinaciones de migración posibles admitidas por CRX2Oak:
Se llama a CRX2Oak durante AEM actualizaciones de forma que el usuario pueda especificar un perfil de migración predefinido que automatice la reconfiguración de los modos de persistencia. Esto se denomina modo de inicio rápido.
También se puede ejecutar por separado en caso de que requiera más personalización. Sin embargo, tenga en cuenta que en este modo solo se realizan cambios en el repositorio y que cualquier reconfiguración adicional de AEM debe realizarse manualmente. Esto se denomina modo independiente.
Otra cosa a tener en cuenta es que con la configuración predeterminada en modo independiente, solo se migrará el almacén de nodos y el nuevo repositorio reutilizará el antiguo almacenamiento binario.
Desde AEM 6.3, CRX2Oak es capaz de gestionar perfiles de migración definidos por el usuario que pueden configurarse con todas las opciones de migración ya disponibles. Esto permite una mayor flexibilidad y la capacidad de automatizar la configuración de AEM funciones que no están disponibles si utiliza la herramienta en modo independiente.
Para cambiar CRX2Oak al modo de inicio rápido, debe definir la ruta a la carpeta crx-quickstart en el directorio de instalación de AEM a través de esta variable ambiental del sistema operativo:
Para sistemas basados en UNIX y macOS:
export SLING_HOME="/path/to/crx-quickstart"
Para Windows:
SET "SLING_HOME=/path/to/crx-quickstart"
La migración se puede interrumpir en cualquier momento, con la posibilidad de reanudarla posteriormente.
La lógica Java personalizada también puede implementarse usando CommitHooks
. Se pueden implementar clases personalizadas RepositoryInitializer
para inicializar el repositorio con valores personalizados.
CRX2Oak también admite operaciones asignadas a memoria de forma predeterminada. La asignación de memoria mejora considerablemente el rendimiento y debe utilizarse siempre que sea posible.
Sin embargo, tenga en cuenta que las operaciones asignadas a memoria no son compatibles con las plataformas Windows. Por lo tanto, se recomienda añadir el parámetro —disable-mmap al realizar la migración en Windows.
De forma predeterminada, la herramienta migra todo el repositorio bajo la ruta "/"
. Sin embargo, tiene control absoluto sobre qué contenido se debe migrar.
Si hay alguna parte del contenido que no sea necesaria en la nueva instancia, puede utilizar el parámetro --exclude-path
para excluir el contenido y optimizar el procedimiento de actualización.
Si es necesario copiar los datos entre dos repositorios y si tiene una ruta de contenido diferente en ambas instancias, puede definirlos en el parámetro --merge-path
. Una vez que lo haga, CRX2Oak copiará solamente los nuevos nodos en el repositorio de destino y mantendrá los antiguos en su lugar.
De forma predeterminada, AEM creará una versión de cada nodo o página que se modifique y la almacenará en el repositorio. A continuación, se pueden usar las versiones para restaurar la página a un estado anterior.
Sin embargo, estas versiones nunca se depuran aunque se elimine la página original. Cuando se trata de repositorios que han estado en funcionamiento durante mucho tiempo, es posible que la migración necesite procesar muchos datos redundantes causados por versiones huérfanas.
Una característica útil para estos tipos de situaciones es la adición del parámetro --copy-versions
. Se puede utilizar para omitir los nodos de versión durante la migración o la copia de un repositorio.
También puede elegir si desea copiar versiones huérfanas agregando --copy-orphaned-versions=true
.
Ambos parámetros también admiten un formato de fecha YYYY-MM-DD
, en caso de que desee copiar versiones a más tardar en una fecha específica.
Una versión de código abierto de CRX2Oak está disponible en forma de oak-upgrade. Admite todas las funciones excepto:
Consulte la Documentación de Apache para obtener más información.
--cache
: Tamaño de caché en MB (el valor predeterminado es 256
)
--mmap
: Habilitar el acceso a archivos asignado a memoria para el almacén de segmentos
--src-password:
Contraseña de la base de datos RDB de origen
--src-user:
Usuario para la RDB de origen
--user
: Usuario para la RDB de destino
--password
: Contraseña para la RDB de destino.
--early-shutdown
: Cierra el repositorio JCR2 de origen después de que se copien los nodos y antes de que se apliquen los enlaces de confirmación
--fail-on-error
: Fuerza un error en la migración si los nodos no se pueden leer desde el repositorio de origen.
--ldap
: Migra los usuarios LDAP de una instancia CQ 5.x a una instancia basada en Oak. Para que esto funcione, el proveedor de identidad en la configuración de Oak debe llamarse ldap. Para obtener más información, consulte la documentación de LDAP.
--ldap-config:
Utilícelo junto con el --ldap
parámetro para repositorios CQ 5.x que usaban varios servidores LDAP para la autenticación. Puede usarlo para señalar a los archivos de configuración CQ5.x ldap_login.conf
o jaas.conf
. El formato es --ldapconfig=path/to/ldap_login.conf
.
--copy-orphaned-versions
: Omite copiar versiones huérfanas. Los parámetros admitidos son: true
, false
y yyyy-mm-dd
. El valor predeterminado es true
.
--copy-versions:
Copia el almacenamiento de la versión. Parámetros: true
, false
, yyyy-mm-dd
. El valor predeterminado es true
.
--include-paths:
Lista separada por comas de las rutas que se incluirán durante la copia--merge-paths
: Lista separada por comas de las rutas que se van a combinar durante la copia--exclude-paths:
Lista de rutas de exclusión durante la copia separadas por comas.--src-datastore:
El directorio del almacén de datos que se utilizará como origen FileDataStore
--src-fileblobstore
: El directorio del almacén de datos que se utilizará como origen FileBlobStore
--src-s3datastore
: El directorio del almacén de datos que se utilizará para el origen S3DataStore
--src-s3config
: El archivo de configuración del origen S3DataStore
.
--datastore:
El directorio del almacén de datos que se utilizará como destino FileDataStore
--fileblobstore:
El directorio del almacén de datos que se utilizará como destino FileBlobStore
--s3datastore
: El directorio del almacén de datos que se utilizará para el destino S3DataStore
--s3config
: El archivo de configuración para el destino S3DataStore
.
-?, -h, --help:
Muestra información de ayuda.También puede habilitar la información de depuración para el proceso de migración para solucionar cualquier problema que pueda aparecer durante el proceso. Puede hacerlo de forma diferente en función del modo en el que desee ejecutar la herramienta:
Modo CRX2Oak | Acción |
Modo de inicio rápido | Puede agregar las opciones —log-level TRACE o —log-level DEBUG a la línea de comandos al ejecutar CRX2Oak. En este modo, los registros se redirigen automáticamente al archivo upgrade.log. |
Modo independiente | Agregue las opciones —trace a la línea de comandos CRX2Oak para mostrar eventos de TRACE en la salida estándar (necesita redireccionar los registros usted mismo usando el carácter de redirección: '>' o 'tee' para inspección posterior). |
Al migrar a un conjunto de réplicas de MongoDB, asegúrese de establecer el parámetro WriteConcern
en 2
en todas las conexiones a las bases de datos de Mongo.
Para ello, agregue el parámetro w=2
al final de la cadena de conexión, de esta manera:
java -Xmx4092m -XX:MaxPermSize=1024m -jar crx2oak.jar crx-quickstart/repository/ mongodb://localhost:27017/aem-author?replicaset=replica1&w=2
Para obtener más información, consulte la documentación de la cadena de conexión MongoDB en Escribir preocupaciones.