A CRX2Oak é uma ferramenta projetada para migrar dados entre repositórios diferentes.
Ele pode ser usado para migrar dados de versões mais antigas do CQ com base no Apache Jackrabbit 2 para o Oak, e também pode ser usado para copiar dados entre repositórios Oak.
Você pode baixar a versão mais recente do crx2oak do repositório do Adobe público neste local:
https://repo1.maven.org/maven2/com/adobe/granite/crx2oak/
A lista de alterações e correções para a versão mais recente pode ser encontrada no Notas de versão do CRX2Oak.
Para obter mais informações sobre o Apache Oak e os principais conceitos de AEM persistência, consulte Introdução à plataforma de AEM.
A ferramenta pode ser usada para:
O suporte para migrar repositórios usando armazenamentos de blobs externos (comumente conhecidos como armazenamentos de dados) é fornecido em combinações diferentes. Um caminho de migração possível é de um repositório CRX2 que está usando um FileDataStore
para um repositório Oak usando um S3DataStore
.
O diagrama abaixo ilustra todas as combinações de migração possíveis compatíveis com o CRX2Oak:
O CRX2Oak é chamado durante AEM atualizações de uma maneira em que o usuário pode especificar um perfil de migração predefinido que automatiza a reconfiguração dos modos de persistência. Isso é chamado de modo de início rápido.
Ele também pode ser executado separadamente, caso exija mais personalização. No entanto, observe que nesse modo, as alterações são feitas apenas no repositório e qualquer reconfiguração adicional de AEM precisa ser executada manualmente. Isso é chamado de modo independente.
Outra coisa a observar é que com as configurações padrão no modo independente, somente a Loja de nós será migrada e o novo repositório reutilizará o armazenamento binário antigo.
Desde o AEM 6.3, o CRX2Oak é capaz de lidar com perfis de migração definidos pelo usuário que podem ser configurados com todas as opções de migração já disponíveis. Isso permite maior flexibilidade e a capacidade de automatizar a configuração de AEM, recursos que não estão disponíveis se você estiver usando a ferramenta no modo independente.
Para alternar o CRX2Oak para o modo de início rápido, é necessário definir o caminho para a pasta crx-quickstart no diretório de instalação AEM por meio dessa variável ambiental do sistema operacional:
Para sistemas baseados em UNIX e macOS:
export SLING_HOME="/path/to/crx-quickstart"
Para Windows:
SET "SLING_HOME=/path/to/crx-quickstart"
A migração pode ser interrompida a qualquer momento, com a possibilidade de retomá-la posteriormente.
A lógica Java personalizada também pode ser implementada usando CommitHooks
. Personalizado RepositoryInitializer
As classes podem ser implementadas para inicializar o repositório com valores personalizados.
O CRX2Oak também oferece suporte a operações mapeadas por memória por padrão. O mapeamento de memória melhora muito o desempenho e deve ser usado sempre que possível.
Observe, no entanto, que as operações mapeadas de memória não são compatíveis com plataformas Windows. Portanto, é recomendável adicionar a variável —disable-mmap ao executar a migração no Windows.
Por padrão, a ferramenta migra o repositório inteiro sob a variável "/"
caminho. No entanto, você tem controle total sobre qual conteúdo deve ser migrado.
Se houver alguma parte do conteúdo que não seja necessária na nova instância, você poderá usar a variável --exclude-path
para excluir o conteúdo e otimizar o procedimento de atualização.
Se os dados precisarem ser copiados entre dois repositórios e você tiver um caminho de conteúdo diferente em ambas as instâncias, poderá defini-lo na variável --merge-path
parâmetro. Depois disso, o CRX2Oak copiará apenas os novos nós no repositório de destino e manterá os antigos no lugar.
Por padrão, o AEM criará uma versão de cada nó ou página que é modificada e a armazenará no repositório. As versões podem ser usadas para restaurar a página para um estado anterior.
No entanto, essas versões nunca são limpas, mesmo se a página original for excluída. Ao lidar com repositórios que estão em operação por muito tempo, a migração pode precisar processar muitos dados redundantes causados por versões órfãs.
Um recurso útil para esses tipos de situações é a adição da variável --copy-versions
parâmetro. Ele pode ser usado para ignorar os nós de versão durante a migração ou cópia de um repositório.
Você também pode optar por copiar versões órfãs adicionando --copy-orphaned-versions=true
.
Ambos os parâmetros também suportam uma YYYY-MM-DD
formato de data, caso queira copiar versões até uma data específica.
Uma versão de código aberto do CRX2Oak está disponível no formato de atualização do oak. É compatível com todos os recursos, exceto:
Consulte a Documentação do Apache para obter mais informações.
--cache
: Tamanho do cache em MB (o padrão é 256
)
--mmap
: Ativar o acesso de arquivo mapeado de memória para a Loja de segmentos
--src-password:
Senha para o banco de dados RDB de origem
--src-user:
Usuário do RDB de origem
--user
: Usuário do RDB direcionado
--password
: Senha para o RDB de destino.
--early-shutdown
: Encerra o repositório JCR2 de origem depois que os nós são copiados e antes que os ganchos de confirmação sejam aplicados
--fail-on-error
: Força uma falha da migração se os nós não puderem ser lidos do repositório de origem.
--ldap
: Migra usuários LDAP de uma instância CQ 5.x para uma baseada em Oak. Para que isso funcione, o Provedor de identidade na configuração do Oak precisa ser nomeado ldap. Para obter mais informações, consulte o Documentação LDAP.
--ldap-config:
Use isso junto com a --ldap
parâmetro para repositórios CQ 5.x que usavam vários servidores LDAP para autenticação. Você pode usá-lo para apontar para o CQ 5.x ldap_login.conf
ou jaas.conf
arquivos de configuração. O formato é --ldapconfig=path/to/ldap_login.conf
.
--copy-orphaned-versions
: Ignora a cópia de versões órfãs. Os parâmetros compatíveis são: true
, false
e yyyy-mm-dd
. O padrão é true
.
--copy-versions:
Copia o armazenamento de versão. Parâmetros: true
, false
, yyyy-mm-dd
. O padrão é true
.
--include-paths:
Lista de caminhos separada por vírgulas a ser incluída durante a cópia--merge-paths
: Lista de caminhos separada por vírgulas para mesclar durante a cópia--exclude-paths:
Lista de caminhos separada por vírgulas a ser excluída durante a cópia.--src-datastore:
O diretório do armazenamento de dados a ser usado como uma origem FileDataStore
--src-fileblobstore
: O diretório do armazenamento de dados a ser usado como uma origem FileBlobStore
--src-s3datastore
: O diretório do armazenamento de dados a ser usado para a origem S3DataStore
--src-s3config
: O arquivo de configuração da origem S3DataStore
.
--datastore:
O diretório do armazenamento de dados a ser usado como destino FileDataStore
--fileblobstore:
O diretório do armazenamento de dados a ser usado como destino FileBlobStore
--s3datastore
: O diretório do armazenamento de dados a ser usado para o destino S3DataStore
--s3config
: O arquivo de configuração do público-alvo S3DataStore
.
-?, -h, --help:
Mostra informações de ajuda.Você também pode ativar as informações de depuração do processo de migração para solucionar problemas que possam aparecer durante o processo. Você pode fazer isso de forma diferente dependendo do modo em que deseja executar a ferramenta:
Modo CRX2Oak | Ação |
Modo de início rápido | Você pode adicionar o —TRACE de nível de log ou —DEBUG de nível de log opções para a linha de comando ao executar o CRX2Oak. Nesse modo, os logs são automaticamente redirecionados para a função arquivo upgrade.log. |
Modo autônomo | Adicione o —traço opções para a linha de comando CRX2Oak para mostrar TRACE events na saída padrão (é necessário redirecionar os logs por conta própria usando o caractere de redirecionamento: '>' ou 'tee' para inspeção posterior). |
Ao migrar para um conjunto de réplicas do MongoDB, defina a variável WriteConcern
para 2
em todas as conexões com os bancos de dados Mongo.
Você pode fazer isso adicionando a variável w=2
no final da string de conexão, desta forma:
java -Xmx4092m -jar crx2oak.jar crx-quickstart/repository/ mongodb://localhost:27017/aem-author?replicaset=replica1&w=2
Para obter mais informações, consulte a documentação da Cadeia de conexão do MongoDB em Preocupações de gravação.