Configuration de la recherche Smart Translation avec AEM Assets

Smart Translation Search permet d’utiliser des termes de recherche non anglais pour résoudre le problème en anglais. Pour configurer l'AEM pour Smart Translation Search, le lot OSGi de Apache Oak Search Machine Translation doit être installé et configuré, ainsi que les paquets de langues Apache Joshua gratuits et open source pertinents qui contiennent les règles de traduction.

REMARQUE

La recherche de traduction intelligente doit être configurée sur chaque instance AEM qui en a besoin.

  1. Téléchargement et installation du lot OSGi Oak Search Machine Translation

    • Téléchargez le lot OSGi de traduction automatique Oak Search qui correspond à AEM version Oak.
    • Installez le lot OSGi de traduction de l'outil de recherche Oak téléchargé dans AEM par /system/console/bundles.
  2. Téléchargement et mise à jour des modules linguistiques Apache Joshua

    • Téléchargez et décompressez les packs de langue Apache Joshua souhaités.

    • Modifiez le fichier joshua.config et placez en commentaire les 2 lignes qui commencent par :

      feature-function = LanguageModel ...
      
    • Déterminez et enregistrez la taille du dossier de modèles du module linguistique, car cela a une incidence sur la quantité d’espace de mémoire supplémentaire AEM nécessaire.

    • Déplacez le dossier Apache Joshua Language Pack décompressé (avec les joshua.config modifications) vers

      .../crx-quickstart/opt/<source_language-target_language>
      

      Par exemple :

       .../crx-quickstart/opt/es-en
      
  3. Redémarrez AEM avec une allocation de mémoire de tas mise à jour

    • Arrêtez AEM

    • Déterminer la nouvelle taille de tas requise pour AEM

      • aem taille du tas de pré-langue sans mémoire + la taille du répertoire de modèles arrondi à 2 Go le plus proche

      • Par exemple : Si l’installation AEM des packs de prélangue nécessite 8 Go de tas pour être exécutée et que le dossier du modèle du pack de langue est de 3,8 Go non compressé, la nouvelle taille du tas est la suivante :

        L'original 8GB + ( 3.75GB arrondi au 2GB le plus proche, qui est 4GB) pour un total de 12GB

    • Vérifiez que la machine dispose de cette quantité de mémoire disponible.

    • Mettre à jour les scripts de début-up AEM pour les adapter à la nouvelle taille du tas

      • Ex. java -Xmx12g -jar cq-author-p4502.jar
    • Redémarrez l'AEM avec la taille du tas augmentée.

    REMARQUE

    L’espace de mémoire requis pour les packs de langues peut s’agrandir, en particulier lorsque plusieurs packs de langues sont utilisés.

    Veillez toujours à ce que l’instance ait suffisamment de mémoire pour s’adapter à l’augmentation de l’espace de tas alloué.

    Le tas de base doit toujours être calculé pour prendre en charge des performances acceptables sans que des modules linguistiques ne soient installés.

  4. Enregistrement des modules linguistiques via les configurations OSGi du fournisseur Apache Jackrabbit Oak Machine Translation Termes de Requête de texte intégral

    • Pour chaque module linguistique, créez une nouvelle configuration OSGi du fournisseur Apache Jackrabbit Oak Machine Translation Termes de Requête de texte intégral OSGi via le gestionnaire de configuration de la console Web AEM.

      • Joshua Config Path est le chemin d’accès absolu au fichier joshua.config. Le processus AEM doit être en mesure de lire tous les fichiers du dossier du module linguistique.

      • Node types sont les types de noeud candidats dont la recherche en texte intégral engage ce pack de langue pour la traduction.

      • Minimum score est le score de confiance minimum pour un terme traduit à utiliser.

        • Par exemple, hombre (en espagnol pour "homme") peut se traduire par le mot anglais "homme" avec un score de confiance de 0.9 et par le mot anglais "humain" avec un score de confiance de 0.2. Si vous définissez le score minimum sur 0.3, vous conservez la traduction "hombre" à "man", mais vous ignorez la traduction "hombre" à "humain" car ce score de traduction de 0.2 est inférieur au score minimum de 0.3.
  5. Exécution d’une recherche de texte intégral sur des fichiers

    • Etant donné que dam:Asset est le type de noeud que ce module linguistique est enregistré à nouveau, nous devons rechercher AEM Assets à l’aide de la recherche de texte intégral pour valider ce paramètre.
    • Accédez à AEM > Ressources et ouvrez Omnisearch. Recherchez un terme dans la langue dans laquelle le pack de langue a été installé.
    • Si nécessaire, ajustez le score minimum dans les configurations OSGi pour garantir la précision des résultats.
  6. Mise à jour des packs de langues

    • Les modules linguistiques Apache Joshua sont entièrement conservés par le projet Apache Joshua, et leur mise à jour ou correction est laissée à la discrétion du projet Apache Joshua.

    • Si un pack de langue est mis à jour, pour installer les mises à jour dans AEM, les étapes 2 à 4 ci-dessus doivent être suivies, en ajustant la taille du tas vers le haut ou vers le bas si nécessaire.

      • Notez que lorsque vous déplacez le pack de langues décompressé vers le dossier crx-quickstart/opt, déplacez tout dossier de pack de langues existant avant de le copier dans le nouveau.
    • Si AEM ne nécessite pas de redémarrage, alors la ou les configurations OSGi du fournisseur Apache Jackrabbit Oak Machien Translation Termes de Requête de traduction complète de Apache Jackrabbit doivent être réenregistrées afin que AEM traite les fichiers mis à jour.

Mise à jour de l'index damAssetLucene

Pour que AEM Balises dynamiques soit affecté par AEM Traduction dynamique, l'index /oak :index /damAssetLucene de l'AEM doit être mis à jour afin de marquer les balises prédites (nom système des "Balises dynamiques") comme faisant partie de l'index Lucene de l'agrégat du fichier.

Sous /oak:index/damAssetLucene/indexRules/dam:Asset/properties/predicatedTags, vérifiez que la configuration est la suivante :

 <damAssetLucene jcr:primaryType="oak:QueryIndexDefinition">
        <indexRules jcr:primaryType="nt:unstructured">
            <dam:Asset jcr:primaryType="nt:unstructured">
                <properties jcr:primaryType="nt:unstructured">
                    ...
                    <predictedTags
                        jcr:primaryType="nt:unstructured"
                        isRegexp="{Boolean}true"
                        name="jcr:content/metadata/predictedTags/*/name"
                        useInSpellheck="{Boolean}true"
                        useInSuggest="{Boolean}true"
                        analyzed="{Boolean}true"
                        nodeScopeIndex="{Boolean}true"/>

Ressources supplémentaires

Sur cette page