Configuração Solr para SRP solr-configuration-for-srp

Solr para plataforma AEM solr-for-aem-platform

Uma instalação do Apache Solr pode ser compartilhada entre o repositório de nós (Oak) e o repositório comum (SRP) usando coleções diferentes.

Se as coleções do Oak e do SRP forem usadas intensamente, um segundo Solr poderá ser instalado por motivos de desempenho.

Para ambientes de produção, o modo SolrCloud oferece melhor desempenho do que o modo autônomo (uma configuração Solr local única).

Requisitos requirements

Baixe e instale o Apache Solr:

Modo SolrCloud solrcloud-mode

O modo SolrCloud é recomendado para ambientes de produção. Ao executar no modo SolrCloud, o SolrCloud deve ser instalado e configurado antes de instalar a Pesquisa multilíngue (MLS).

A recomendação é seguir as instruções da SolrCloud para instalar:

  • 3 nós SolrCloud no mesmo servidor.
  • Um ZooKeeper externo do Apache.

Também é recomendável configurar a JVM para ajustar o uso de memória e a coleta de lixo.

Exemplo de configuração de JVM jvm-configuration-example

JVM_OPTS="-server -Xmx2048m -XX:+UseConcMarkSweepGC -XX:+CMSClassUnloadingEnabled -Xloggc:../logs/gc.log -XX:+PrintGCDetails -XX:+PrintGCDateStamps -Djava.awt.headless=true"

Comandos de configuração do SolrCloud solrcloud-setup-commands

Ao executar no modo SolrCloud, antes da instalação do MLS, é necessário usar e conhecer os seguintes comandos de configuração do SolrCloud.

1. Fazer upload de uma configuração no ZooKeeper upload-a-configuration-to-zookeeper

Referência:
https://solr.apache.org/guide/6_6/command-line-utilities.html

Uso:
sh./scripts/cloud-scripts/zkcli.sh
-cmd upconfig
-zkhost servidor:porta
-confname *myconfig-name *
-solrhome solr-home-path
-confdir config-dir

2. Criar uma coleção create-a-collection

Referência:
https://solr.apache.org/guide/6_6/solr-control-script-reference.html#SolrControlScriptReference-Create

Uso:
./bin/solr create
-c nome-da-minha-coleção
-d config-dir
-n myconfig-name
-p porta
-s número-de-fragmentos
-rf número-de-réplicas

Vincular uma coleção a uma configuração já carregada no ZooKeeper.

Referência:
https://solr.apache.org/guide/6_6/command-line-utilities.html

Uso:
sh./scripts/cloud-scripts/zkcli.sh
-cmd linkconfig
-zkhost servidor:porta
-coleção nome-da-minha-coleção
-confname myconfig-name

Comparação de MLS Padrão e Avançado comparison-of-standard-and-advanced-mls

A Pesquisa multilíngue (MLS) para o AEM Communities foi criada para a plataforma Solr, a fim de fornecer pesquisa aprimorada em todos os idiomas compatíveis, incluindo inglês.

O MLS para AEM Communities está disponível como MLS Padrão ou MLS Avançado. O MLS padrão inclui apenas as definições de configuração Solr e exclui todos os plug-ins ou arquivos de recurso. O MLS avançado é a solução mais abrangente e inclui definições e plug-ins de configuração Solr e recursos relacionados

O MLS padrão inclui aprimoramentos para a pesquisa de conteúdo nos seguintes idiomas:

  • English: Improved stemmer for attempt to match word derivations. (Inglês: Melhoria do lemmer para tentar combinar derivações de palavras.)
  • Japonês: aprimoramento da geração de tokens em japonês para caracteres de meia largura.

O MLS avançado inclui aprimoramentos na pesquisa de conteúdo para os seguintes idiomas:

  • Inglês: Replacement stemmer with lemmatizer.
  • Alemão: adição do decompounder.
  • Francês: Adição de controle de elisão.
  • Chinês (simplificado): adição de um tokenizer mais inteligente.
  • Vários idiomas: Adição de um lematizador, uma lista de palavras de interrupção e um normalizador.

Ao todo, os 33 idiomas a seguir são suportados no MLS avançado.

Árabe
Alemão
Norueguês
Búlgaro
Grego
Polonês
Chinês (simplificado)
Crioulo haitiano
Português
Chinês (Tradicional)
Hebraico
Romeno
Tcheco
Húngaro
Russo
Dinamarquês
Indonésio
Eslovaco
Holandês
Italiano
Esloveno
Inglês
Japonês
Espanhol
Estoniano
Coreano
Sueco
Finlandês
Letão
Tailandês
Francês
Lituano
Turco

Comparação entre pesquisa AEM 6.1 Solr, MLS padrão e MLS avançado comparison-of-aem-solr-search-standard-mls-and-advanced-mls

Observação: AEM 6.1 refere-se ao AEM 6.1 Communities FP3 e anterior.

compare-solr-mls

Instalando o MLS Padrão installing-standard-mls

Para a coleção SRP (MSRP ou DSRP), para oferecer suporte à Pesquisa Multilíngue Padrão (MLS), é necessário modificar dois dos arquivos de configuração do Solr:

  • schema.xml
  • solrconfig.xml

Arquivos MLS padrão (schema.xml, solrconfig.xml) para Solr 4.10.

Arquivos MLS padrão (schema.xml, solrconfig.xml) para Solr 5.x.

Os arquivos MLS padrão são armazenados no repositório AEM.

Observação: embora os arquivos Solr sejam armazenados na pasta msrp/, eles também são para DSRP (nenhuma alteração é necessária).

Instruções de download: substitua solrX por solr4 ou solr5 conforme apropriado.

  1. Usando o CRXDE|Lite, localize:

    • /libs/social/config/datastore/msrp/solrX/schema.xml
    • /libs/social/config/datastore/msrp/solrX/solrconfig.xml
  2. Baixar para o servidor local no qual o Solr está implantado.

    • Localize a propriedade jcr:data do nó jcr:content.
    • Para iniciar o download, selecione view.
    • Verifique se os arquivos foram salvos com os nomes e a codificação apropriados (UTF8).
  3. Siga as instruções de instalação para o modo independente ou SolrCloud.

Modo SolrCloud - MLS Padrão solrcloud-mode-standard-mls

  1. Instalar e configurar o Solr no modo SolrCloud.

  2. Preparar uma nova configuração:

    1. Criar new-config-dir* como solr-install-dir*/myconfig/

    2. Copiar o conteúdo do diretório de configuração Solr existente para new-config-dir

      • Para Solr4: copiar solr-install-dir/example/solr/collection1/conf/
      • Para Solr5: copiar solr-install-dir/server/solr/configsets/data_driven_schema_configs/
    3. Copie o schema.xml e solrconfig.xml baixado para new-config-dir para substituir arquivos existentes.

  3. Carregar a nova configuração para o ZooKeeper.

  4. Crie uma coleção especificando os parâmetros necessários, como o número de fragmentos, o número de réplicas e o nome da configuração.

  5. Se o nome da configuração *não foi *fornecido durante a criação da coleção, vincule esta coleção recém-criada com a configuração carregada no ZooKeeper.

  6. Para MSRP, execute a Ferramenta de Reindexação do MSRP, a menos que esta instalação seja nova.

Modo Independente - MLS Padrão standalone-mode-standard-mls

  1. Instale o Solr no modo independente.

  2. Se estiver executando Solr5, crie uma coleção1 (semelhante a Solr4):

    • ./bin/solr start
    • ./bin/solr create_core -c collection1 -d sample_techproducts_configs
  3. Fazer backup de schema.xml e solrconfig.xml no diretório de configuração Solr, como:

    • Para Solr4: solr-install-dir/example/solr/collection1/conf/
    • Criado para Solr5: solr-install-dir/server/solr/collection1/conf/
  4. Copie o schema.xml e o solrconfig.xml baixados nesse mesmo diretório.

  5. Reiniciar Solr.

  6. Para MSRP, execute a Ferramenta de Reindexação do MSRP, a menos que esta instalação seja nova.

Instalando o MLS Avançado installing-advanced-mls

Para que a coleção SRP (MSRP ou DSRP) seja compatível com MLS avançado, novos plug-ins Solr são necessários, além de um esquema personalizado e uma configuração Solr. Todos os itens necessários são empacotados em um arquivo zip para download. Além disso, um script de instalação é incluído para uso quando o Solr é implantado no modo independente.

Para obter o pacote MLS Avançado, consulte MLS Avançado do AEM na seção de implantação da documentação.

Para começar a instalação do SolrCloud ou do modo independente:

  • Faça o download do arquivo zip AEM-SOLR-MLS para o servidor que hospeda o Solr.
  • Descompacte o arquivo.

Modo SolrCloud - MLS Avançado solrcloud-mode-advanced-mls

Instruções de instalação - observe as poucas diferenças para Solr4 e Solr5:

  1. Instalar e configurar o Solr no modo SolrCloud.

  2. Extraia o conteúdo do pacote MLS Avançado para o disco. O conteúdo deve incluir:

    • schema.xml
    • solrconfig.xml
    • Pasta palavras irrelevantes/
    • Pasta perfis/
    • Pasta extra-libs/
  3. Preparar uma nova configuração:

    1. Criar um new-config-dir

      • Como solr-install-dir/myconfig/
      • Criar subpastas stopwords/ e lang/
    2. Copiar o conteúdo do diretório de configuração Solr existente para new-config-dir

      • Para Solr4: Copiar solr-install-dir/example/solr/collection1/conf/
      • Para Solr5: Copiar solr-install-dir/server/solr/configsets/data_driven_schema_configs/
    3. Copie o schema.xml e o solrconfig.xml extraídos para new-config-dir para substituir os arquivos existentes.

    4. Para Solr5: Copiar solr_install_dir/server/solr/configsets/sample_techproducts_configs/conf/lang/*.txt para new-config-dir/lang/

    5. Copiar a pasta stopwords/ extraída para new-config-dir, resultando em new-config-dir/stopwords/*.txt

  4. Carregar a nova configuração para o ZooKeeper

  5. Copiar a nova pasta perfis/

    • Para Solr4: Copiar para a pasta/recursos de cada nó
    • Para Solr5: Copiar para a pasta/recursos/servidor de cada instalação Solr. Se todos os nós estiverem no mesmo diretório de instalação Solr, essa etapa será executada apenas uma vez.
  6. Crie uma pasta lib/ no diretório solr-home (contém solr.xml) de cada nó na SolrCloud. Copie os jars dos seguintes locais para a nova biblioteca/pasta em cada nó:

    • extra-libs/ extraído do pacote MLS avançado
    • solr-install-dir/contrib/extraction/lib/.jar
    • solr-install-dir/dist/solr-cell.jar
    • solr-install-dir/contrib/clustering/lib/.jar
    • solr-install-dir/dist/solr-clustering.jar
    • solr-install-dir/contrib/langid/lib/.jar
    • solr-install-dir/dist/solr-langid.jar
    • solr-install-dir/contrib/velocity/lib/.jar
    • solr-install-dir/dist/solr-velocity.jar
    • solr-install-dir/contrib/analysis-extras/lib/.jar
    • solr-install-dir/contrib/analysis-extras/lucene-libs/.jar
  7. Crie uma coleção especificando os parâmetros necessários, como o número de fragmentos, o número de réplicas e o nome da configuração.

  8. Se o nome da configuração foi não fornecido durante a criação da coleção, vincule esta coleção recém-criada com a configuração carregada no ZooKeeper.

  9. Para MSRP, execute a Ferramenta de Reindexação do MSRP, a menos que esta instalação seja nova.

Modo Independente - MLS Avançado standalone-mode-advanced-mls

Um script de instalação está incluído no pacote MLS Avançado.

Depois que o conteúdo do pacote for extraído para o servidor que hospeda o servidor Solr independente, execute o script de instalação para instalar os recursos necessários e os arquivos de configuração.

  • Instale o Solr no modo independente.

  • Se estiver executando Solr5, crie uma coleção1 (semelhante a Solr4):

    • ./bin/solr start
    • ./bin/solr create_core -c collection1 -d sample_techproducts_configs
  • Execute o script de instalação: Instalar [-v 4|5] [-d solrhome] [-c collectionpath]
    em que:

    • ​- d solrhome

      Diretório de instalação Solr

    • -c caminho de coleção

      Caminho da coleção em solr

    • — help

      Imprimir opções da linha de comando

    • -v [4|5]

      Definir versão para solr

  • Exemplo para Solr 4.10.4:

    • Install.bat -v 4 -d c:/solr-4.10.4 -c c:/solr-4.10.4/example/solr/collection1
  • Exemplo para Solr 5.4.0:

    • Install.sh -v 5 -d /tmp/solr-5.4.0 -c /tmp/solr-5.4.0/server/solr/collection1

Nota:

  • O script de instalação faz backup de schema.xml e solrconfig.xml antes de instalar novas versões anexando ".orig"

Sobre solrconfig.xml about-solrconfig-xml

O arquivo solrconfig.xml controla o intervalo de confirmação automática e a visibilidade da pesquisa e requer testes e ajuste.

<autoCommit>: por padrão, o intervalo AutoCommit, que é uma confirmação forçada para armazenamento estável, é definido como 15 segundos. A visibilidade da pesquisa é padronizada como usar o índice pré-confirmação.

Para alterar a pesquisa para usar um índice atualizado para refletir as alterações causadas pela confirmação, altere o openSearcher contido para verdadeiro.

autoSoftCommit: uma confirmação 'suave' garante que as alterações estejam visíveis (o índice é atualizado), mas não garante que as alterações sejam sincronizadas com o armazenamento estável (confirmação permanente). O resultado é uma melhoria no desempenho. Por padrão, autoSoftCommit está desabilitado com o maxTime contido definido como -1.

recommendation-more-help
81e2cd9d-0789-409d-b87c-2a8ce4f28791