Há duas maneiras de fazer backup e restaurar o conteúdo do repositório no AEM:
A abordagem descrita aqui aplica-se ao backup e à recuperação do sistema.
Se você precisar fazer backup e/ou recuperar uma pequena quantidade de conteúdo, que é perdida, a recuperação do sistema não é necessariamente necessária:
Para obter detalhes, consulte Backup de pacotes abaixo.
Não execute o backup em paralelo com a coleta de lixo do armazenamento de dados, pois isso pode prejudicar os resultados de ambos os processos.
Você sempre pode fazer um backup offline. Isso requer um tempo de inatividade de AEM, mas pode ser bastante eficiente em termos de tempo necessário em comparação a um backup online.
Na maioria dos casos, você usará um instantâneo do sistema de arquivos para criar uma cópia somente leitura do armazenamento no momento. Para criar um backup offline, execute estas etapas:
Como o backup de snapshot geralmente leva apenas alguns segundos, todo o tempo de inatividade é menor do que alguns minutos.
Esse método de backup cria um backup de todo o repositório, incluindo todos os aplicativos implantados nele, como AEM. O backup inclui conteúdo, histórico de versões, configuração, software, hotfixes, aplicativos personalizados, arquivos de log, índices de pesquisa e assim por diante. Se você estiver usando clustering e se a pasta compartilhada for um subdiretório de crx-quickstart
(fisicamente ou usando um software link), o diretório compartilhado também é copiado.
Você pode restaurar o repositório inteiro (e qualquer aplicativo) posteriormente.
Este método opera como um backup "ativo" ou "online" para que possa ser executado enquanto o repositório está em execução. Portanto, o repositório é utilizável enquanto o backup está em execução. Esse método funciona para as instâncias de repositório padrão, baseadas em armazenamento Tar.
Ao criar um backup, você tem as seguintes opções:
Em qualquer caso, o backup cria uma imagem (ou instantâneo) do repositório. Em seguida, o agente de backup de sistemas deve tomar cuidado para transferir essa imagem para um sistema de backup dedicado (unidade de fita).
Se AEM recurso de Backup Online for usado em uma instância AEM que tenha uma configuração de blobstore personalizada, é recomendável configurar o caminho do armazenamento de dados para ficar fora do " crx-quickstart
" e faça backup do armazenamento de dados separadamente.
O backup online faz o backup apenas do sistema de arquivos. Se você armazenar o conteúdo do repositório e/ou os arquivos do repositório em um banco de dados, esse banco de dados precisará fazer backup separadamente. Se estiver usando AEM com MongoDB, consulte a documentação sobre como usar o Ferramentas de backup nativo MongoDB.
Um backup online do seu repositório permite criar, baixar e excluir arquivos de backup. É um recurso de backup "ativo" ou "online", portanto, pode ser executado enquanto o repositório está sendo usado normalmente no modo de leitura/gravação.
Não execute AEM Online Backup simultaneamente com Coleta de lixo do armazenamento de dados ou Limpeza de Revisão. Isso afetará negativamente o desempenho do sistema.
Ao iniciar um backup, você pode especificar um Caminho do Target e/ou Atraso.
Caminho do Target Geralmente, os arquivos de backup são salvos na pasta pai da pasta que contém o arquivo jar de início rápido (.jar). Por exemplo, se você tiver o arquivo jar AEM localizado em /InstallationKits/AEM, o backup será gerado em /InstallationKits. Você também pode especificar um target para um local de sua escolha.
Se a variável TargetPath for um diretório, a imagem do repositório será criada nesse diretório. Se o mesmo diretório for usado várias vezes (ou sempre) para armazenar backup,
If TargetPath está definida como nome de arquivo com a extensão .zip, o repositório é feito backup em um diretório temporário e, em seguida, o conteúdo desse diretório temporário é compactado e armazenado no arquivo ZIP.
Esta abordagem é desencorajada, porque
Se precisar criar um ZIP como formato de backup, faça backup em um diretório e use um programa de compactação para criar o arquivo zip.
Atraso Indica um atraso de tempo (em milissegundos), para que o desempenho do repositório não seja afetado. Por padrão, o backup do repositório é executado em velocidade total. Você pode atrasar a criação de um backup online, de modo que ele não retarde outras tarefas.
Ao usar um atraso muito grande, certifique-se de que o backup online não demore mais de 24 horas. Caso tenha, descarte esse backup, pois ele pode não conter todos os binários.
Um atraso de 1 milissegundo normalmente resulta em 10% de uso da CPU e um atraso de 10 milissegundos normalmente resulta em menos de 3% de uso da CPU. O atraso total em segundos pode ser estimado da seguinte maneira: Tamanho do repositório em MB, multiplicado pelo atraso em milissegundos, dividido por 2 (se a opção zip for usada) ou dividido por 4 (ao fazer backup em um diretório). Isso significa que o backup em um diretório de um repositório de 200 MB com atraso de 1 ms aumenta o tempo de backup em cerca de 50 segundos.
Consulte Como funciona o AEM Online Backup para obter detalhes internos do processo.
Para criar um backup:
Faça logon no AEM como administrador.
Ir para Ferramentas - Operações - Backup.
Clique em Criar. O console de backup será aberto.
No console de backup, especifique o Caminho do Target e Atraso.
O console de backup também está disponível usando:
https://<*hostname*>:<*port-number*>/libs/granite/backup/content/admin.html
Clique em Salvar, uma barra de progresso indicará o progresso do backup.
Você pode Cancelar um backup em execução a qualquer momento.
Quando o backup é concluído, os arquivos zip são listados na janela de backup.
Os arquivos de backup que não são mais necessários podem ser removidos usando o console. Selecione o arquivo de backup no painel esquerdo e clique em Excluir.
Caso tenha feito backup em um diretório: após a conclusão do processo de backup, AEM não gravará no diretório de destino.
Se possível, o backup online deve ser executado quando houver pouca carga no sistema, por exemplo, pela manhã.
Os backups podem ser automatizados usando o wget
ou curl
Clientes HTTP. Os exemplos a seguir mostram como automatizar o backup usando curl.
No exemplo a seguir, vários parâmetros na variável curl
pode precisar ser configurado para a sua instância; por exemplo, o nome de host ( localhost
), porta ( 4502
), senha do administrador ( xyz
) e o nome do arquivo ( backup.zip
).
curl -u admin:admin -X POST http://localhost:4502/system/console/jmx/com.adobe.granite:type=Repository/op/startBackup/java.lang.String?target=backup.zip
O arquivo/diretório de backup é criado no servidor na pasta pai da pasta que contém o crx-quickstart
pasta (o mesmo que você estivesse criando o backup usando o navegador). Por exemplo, se você instalou AEM no diretório /InstallationKits/crx-quickstart/
, em seguida, o backup é criado no /InstallationKits
diretório.
O comando curl retorna imediatamente, portanto, é necessário monitorar esse diretório para ver quando o arquivo zip está pronto. Enquanto o backup está sendo criado, um diretório temporário (com o nome baseado no do arquivo zip final) pode ser visto, no final, isso será compactado. Por exemplo:
backup.zip
backup.f4d5.temp
Geralmente, o arquivo/diretório de backup é criado no servidor na pasta pai da pasta que contém o crx-quickstart
pasta.
Se você quiser salvar seu backup (de qualquer tipo) em um local diferente, poderá definir um caminho absoluto "para a variável target
no curl
comando.
Por exemplo, para gerar backupJune.zip
no diretório /Backups/2012
:
curl -u admin:admin -X POST http://localhost:4502/system/console/jmx/com.adobe.granite:type=Repository/op/startBackup/java.lang.String?target=/Backups/2012/backupJune.zip"
Ao usar um servidor de aplicativos diferente (como o JBoss), o backup online pode não funcionar como esperado, pois o diretório de destino não é gravável. Nesse caso, entre em contato com o Suporte.
Um backup também pode ser acionado usando os MBeans fornecidos pelo AEM.
O processo descrito aqui é especialmente adequado para repositórios grandes.
Se você quiser usar essa abordagem de backup, seu sistema deverá oferecer suporte a snapshots do sistema de arquivos. Por exemplo, para Linux, isso significa que os sistemas de arquivos devem ser colocados em um volume lógico.
Faça um instantâneo do AEM do sistema de arquivos implantado em.
Monte o instantâneo do sistema de arquivos.
Faça um backup e desmonte o instantâneo.
O AEM Online Backup é composto por uma série de ações internas para garantir a integridade dos dados que estão sendo copiados em backup e os arquivos de backup que estão sendo criados. Eles estão listados abaixo para os interessados.
O backup online usa o seguinte algoritmo:
Ao criar um arquivo zip, a primeira etapa é criar ou localizar o diretório de destino.
Se estiver fazendo backup em um arquivo zip, um diretório temporário será criado. O nome do diretório começa com backup.
e termina com .temp
; por exemplo backup.f4d3.temp
.
Se estiver fazendo backup em um diretório, o nome especificado no caminho de destino será usado. Um diretório existente pode ser usado, caso contrário, um novo diretório será criado.
Um arquivo vazio chamado backupInProgress.txt
é criado no diretório de destino quando o backup é iniciado. Esse arquivo é excluído quando o backup é concluído.
Os arquivos são copiados do diretório de origem para o diretório de destino (ou diretório temporário ao criar um arquivo zip). O armazenamento de segmentos é copiado antes do armazenamento de dados para evitar a corrupção do repositório. Os dados de índice e cache são omitidos ao criar o backup. Como resultado, os dados de crx-quickstart/repository/cache
e crx-quickstart/repository/index
não está incluído no backup. O indicador da barra de progresso do processo está entre 0% - 70% ao criar um arquivo zip ou 0% - 100% se nenhum arquivo zip for criado.
Se o backup estiver sendo feito em um diretório pré-existente, os arquivos "antigos" no diretório de destino serão excluídos. Arquivos antigos são arquivos que não existem no diretório de origem.
Os arquivos são copiados para o diretório de destino em quatro estágios:
No primeiro estágio da cópia (indicador de progresso 0% - 63% ao criar um arquivo zip ou 0% - 90% se nenhum arquivo zip for criado), todos os arquivos serão copiados enquanto o repositório estiver sendo executado normalmente. O processo tem duas fases:
No segundo estágio da cópia (indicador de progresso 63% - 65,8% ao criar um arquivo zip ou 90% - 94% se nenhum arquivo zip for criado), somente os arquivos que foram criados ou modificados no diretório de origem desde que o primeiro estágio da cópia foi iniciado são copiados. Dependendo da atividade do repositório, isso pode variar desde nenhum arquivo, até um número significativo de arquivos (porque o primeiro estágio de cópia de arquivo geralmente leva muito tempo). O processo de cópia é semelhante ao primeiro estágio (Fase A e Fase B com atraso).
No terceiro estágio da cópia (indicador de progresso 65,8% - 68,6% ao criar um arquivo zip ou 94% - 98% se nenhum arquivo zip for criado), somente os arquivos que foram criados ou modificados no diretório de origem desde que o segundo estágio da cópia foi iniciado são copiados. Dependendo da atividade do repositório, pode não haver arquivos para copiar ou um número muito pequeno de arquivos (porque o segundo estágio de cópia de arquivo geralmente é rápido). O processo de cópia é semelhante à segunda fase - Fase A e Fase B, mas sem demora.
As etapas de cópia de arquivo um a três são todas feitas simultaneamente enquanto o repositório está em execução. Somente os arquivos que foram criados ou modificados no diretório de origem desde que o terceiro estágio de cópia foi iniciado são copiados. Dependendo da atividade do repositório, pode não haver arquivos para copiar ou um número muito, muito pequeno de arquivos (porque o segundo estágio de cópia de arquivo geralmente é muito rápido). Indicador de progresso 68,6% - 70% ao criar um arquivo zip ou 98% - 100% se nenhum arquivo zip for criado. O processo de cópia é semelhante ao terceiro estágio.
Dependendo do target:
backupInProgress.txt
é excluído para indicar que o backup foi concluído.Você pode restaurar um backup da seguinte maneira:
Para fazer o backup e restaurar o conteúdo, você pode usar um do Gerenciador de pacotes, que usa o formato Pacote de conteúdo para fazer o backup e restaurar o conteúdo. O Gerenciador de pacotes oferece mais flexibilidade para definir e gerenciar pacotes.
Para obter detalhes sobre os recursos e compensações de cada um desses formatos de pacote de conteúdo individual, consulte Como trabalhar com pacotes.
Quando você faz backup de nós usando o Gerenciador de Pacotes ou o Zipper de Conteúdo, o CRX salva as seguintes informações:
Ao fazer o backup, AEM perde as seguintes informações: