Configurar a pesquisa de tradução inteligente com o AEM Assets set-up-smart-translation-search-with-aem-assets

A Pesquisa de tradução inteligente permite o uso de termos de pesquisa em outros idiomas para resolver para conteúdo em inglês. Para configurar o AEM para a Pesquisa de tradução inteligente, o pacote OSGi da Tradução automática de pesquisa do Apache Oak deve ser instalado e configurado, bem como os pacotes de idiomas pertinentes do Apache Joshua, gratuitos e de código aberto, que contêm as regras de tradução.

NOTE
A Pesquisa de tradução inteligente deve ser configurada em cada instância do AEM que a exija.
  1. Baixe e instale o pacote OSGi de tradução automática do Oak Search

  2. Baixar e atualizar os pacotes de idiomas do Apache Joshua

    • Baixe e descompacte o arquivo desejado Pacotes de idioma do Apache Joshua.

    • Edite o joshua.config arquive e comente as 2 linhas que começam com:

      code language-none
      feature-function = LanguageModel ...
      
    • Determine e registre o tamanho da pasta de modelo do pacote de idioma, pois isso influencia a quantidade de espaço extra de heap que o AEM exigirá.

    • Mova a pasta descompactada do pacote de idiomas Apache Joshua (com o joshua.config edições) a

      code language-none
      .../crx-quickstart/opt/<source_language-target_language>
      

      Por exemplo:

      code language-none
       .../crx-quickstart/opt/es-en
      
  3. Reiniciar o AEM com alocação de memória heap atualizada

    • Parar AEM

    • Determine o novo tamanho de heap necessário para o AEM

      • Tamanho do heap de pré-idioma do AEM + o tamanho do diretório modelo arredondado para os 2 GB mais próximos

      • Por exemplo: se os pacotes de pré-idioma para a instalação do AEM exigirem 8 GB de heap para serem executados e a pasta de modelo do pacote de idioma for 3,8 GB descompactada, o novo tamanho do heap será:

        O original 8GB + ( 3.75GB arredondado para cima até o mais próximo 2GB, que é 4GB) para um total de 12GB

    • Verifique se o computador tem essa quantidade de memória extra disponível.

    • Atualize os scripts de inicialização do AEM para ajustar o novo tamanho da pilha

      • Ex. java -Xmx12g -jar cq-author-p4502.jar
    • Reinicie o AEM com o tamanho de heap aumentado.

    note note
    NOTE
    O espaço de heap necessário para pacotes de idiomas pode aumentar, especialmente quando vários pacotes de idiomas são usados.
    Sempre verifique se a instância tem memória suficiente para acomodar os aumentos no espaço de heap alocado.
    A variável o heap base sempre deve ser calculado para suportar o desempenho aceitável sem nenhum pacote de idioma instalado.
  4. Registrar os pacotes de idiomas por meio das configurações OSGi do Apache Jackrabbit Oak Machine Translation Full-text Query Terms Provider

    • Para cada pacote de idioma, criar uma nova configuração OSGi do provedor de termos de consulta de texto completo da tradução automática do Apache Jackrabbit Oak através do gerenciador de configuração do console da Web AEM.

      • Joshua Config Path é o caminho absoluto para o arquivo joshua.config. O processo AEM deve ser capaz de ler todos os arquivos na pasta do pacote de idioma.

      • Node types são os tipos de nó candidato cuja pesquisa de texto completo envolverá este pacote de idiomas para tradução.

      • Minimum score é a pontuação de confiança mínima para um termo traduzido para ser usado.

        • Por exemplo, hombre (espanhol para "homem") pode traduzir para a palavra em inglês "man" com uma pontuação de confiança de 0.9 e também traduzir para a palavra em inglês "human" com uma pontuação de confiança 0.2. Ajuste da pontuação mínima para 0.3, manteria a tradução de "hombre" para "man", mas descartaria a tradução de "hombre" para "human", pois essa pontuação de tradução de 0.2 é menor que a pontuação mínima de 0.3.
  5. Executar uma pesquisa de texto completo em relação a ativos

    • Como dam:Asset é o tipo de nó no qual esse pacote de idioma está registrado novamente, devemos pesquisar o AEM Assets usando a pesquisa de texto completo para validar isso.
    • Navegue até AEM > Assets e abra o Omnisearch. Procure por um termo no idioma cujo pacote de idioma foi instalado.
    • Conforme necessário, ajuste a Pontuação mínima nas configurações do OSGi para garantir a precisão dos resultados.
  6. Atualizando pacotes de idiomas

    • Pacotes de linguagem Apache Joshua são totalmente mantidos pelo projeto Apache Joshua, e sua atualização ou correção é como a discrição do projeto Apache Joshua.

    • Se um pacote de idiomas for atualizado, para instalar as atualizações no AEM, siga as etapas 2 a 4 acima, ajustando o tamanho da pilha para cima ou para baixo, conforme necessário.

      • Observe que ao mover o pacote de idioma descompactado para a pasta crx-quickstart/opt, mova qualquer pasta existente de pacote de idioma antes de copiar na nova pasta.
    • Se o AEM não exigir uma reinicialização, as configurações relevantes de OSGi do provedor de termos de consulta de texto completo da tradução de máquina Apache Jackrabbit Oak que pertencem aos pacotes de idiomas atualizados devem ser salvas novamente para que o AEM processe os arquivos atualizados.

Atualização do índice damAssetLucene updating-damassetlucene-index

A fim de Tags inteligentes do AEM ser afetado pela tradução inteligente do AEM, AEM /oak :index /damAssetLucene O índice deve ser atualizado para marcar as predictedTags (o nome do sistema para "Tags inteligentes") como parte do índice Lucene agregado do ativo.

Em /oak:index/damAssetLucene/indexRules/dam:Asset/properties/predicatedTags, verifique se a configuração é a seguinte:

 <damAssetLucene jcr:primaryType="oak:QueryIndexDefinition">
        <indexRules jcr:primaryType="nt:unstructured">
            <dam:Asset jcr:primaryType="nt:unstructured">
                <properties jcr:primaryType="nt:unstructured">
                    ...
                    <predictedTags
                        jcr:primaryType="nt:unstructured"
                        isRegexp="{Boolean}true"
                        name="jcr:content/metadata/predictedTags/*/name"
                        useInSpellheck="{Boolean}true"
                        useInSuggest="{Boolean}true"
                        analyzed="{Boolean}true"
                        nodeScopeIndex="{Boolean}true"/>

Recursos adicionais additional-resources

recommendation-more-help
a483189e-e5e6-49b5-a6dd-9c16d9dc0519