La recherche de traduction intelligente permet d’utiliser des termes de recherche non anglais pour résoudre du contenu en anglais. Pour configurer AEM pour la recherche de traduction intelligente, le lot OSGi de traduction automatique de recherche Apache Oak doit être installé et configuré, ainsi que les modules de langue Apache Joshua (logiciels libres et open source) pertinents qui contiennent les règles de traduction.
La recherche de traduction intelligente doit être configurée sur chaque instance AEM qui la requiert.
Téléchargez et installez le lot OSGi Oak Search Machine Translation
/system/console/bundles
.Télécharger et mettre à jour les modules de langue Apache Joshua
Téléchargez et décompressez les packs de langue Apache Joshua souhaités.
Modifiez le fichier joshua.config
et commentez les 2 lignes qui commencent par :
feature-function = LanguageModel ...
Déterminez et enregistrez la taille du dossier de modèles du module de langue, car cela influence l’AEM d’espace de tas supplémentaire nécessaire.
Déplacez le dossier Apache Joshua language pack décompressé (avec les joshua.config
modifications) vers
.../crx-quickstart/opt/<source_language-target_language>
Par exemple :
.../crx-quickstart/opt/es-en
Redémarrez l’AEM avec une allocation de mémoire de tas mise à jour.
Arrêtez AEM
Déterminer la nouvelle taille de tas requise pour AEM
AEM la taille du tas avant la langue + la taille du répertoire de modèle arrondie à 2 Go
Par exemple : Si l’installation des packs de langue d’AEM nécessite 8 Go de tas pour être exécutée et que le dossier de modèle du pack de langue est de 3,8 Go décompressé, la nouvelle taille du tas est la suivante :
Le 8GB
+ ( 3.75GB
arrondi au 2GB
le plus proche, c’est-à-dire 4GB
) pour un total de 12GB
Vérifiez que la machine dispose de cette quantité supplémentaire de mémoire disponible.
Mettre à jour AEM scripts de démarrage pour ajuster la nouvelle taille du tas
java -Xmx12g -jar cq-author-p4502.jar
Redémarrez l’AEM avec la taille de tas augmentée.
L’espace de tas requis pour les packs de langue peut s’agrandir, en particulier lorsque plusieurs packs de langue sont utilisés.
Veillez toujours à ce que l’instance dispose de suffisamment de mémoire pour s’adapter à l’augmentation de l’espace de tas alloué.
Le segment de base doit toujours être calculé pour prendre en charge des performances acceptables sans aucun module de langue installé.
Enregistrez les modules de langue via les configurations OSGi du fournisseur de termes de requête en texte intégral de traduction automatique Apache Jackrabbit Oak
Pour chaque module de langue, créez une configuration OSGi Apache Jackrabbit Oak Machine Translation Full-text Query Terms Provider via le gestionnaire de configuration de la console web d’AEM.
Joshua Config Path
est le chemin d’accès absolu au fichier joshua.config . Le processus AEM doit pouvoir lire tous les fichiers du dossier du module de langue.
Node types
sont les types de noeuds candidats dont la recherche de texte intégral engage ce module de langue pour traduction.
Minimum score
est le score de confiance minimal pour un terme traduit à utiliser.
0.9
et se traduire également par le mot anglais "humain" avec un score de confiance 0.2
. En définissant le score minimum sur 0.3
, vous conservez la traduction "hombre" à "man", mais ignorez la traduction "hombre" à "humain", car ce score de traduction de 0.2
est inférieur au score minimum de 0.3
.Exécution d’une recherche de texte intégral sur des ressources
Mise à jour des packs de langue
Les packs de langues Apache Joshua sont entièrement conservés par le projet Apache Joshua, et leur mise à jour ou correction est la discrétion du projet Apache Joshua.
Si un module de langue est mis à jour, pour installer les mises à jour dans AEM, les étapes 2 à 4 ci-dessus doivent être suivies, en ajustant la taille du tas vers le haut ou vers le bas, selon les besoins.
Si AEM ne nécessite pas de redémarrage, la configuration OSGi appropriée Apache Jackrabbit Oak Machien Translation Fulltext Query Terms Provider pour le(s) pack(s) de langue mis à jour doit être réenregistrée afin AEM traiter les fichiers mis à jour.
Pour que AEM les balises intelligentes soient affectées par AEM traduction dynamique, l’index /oak :index /damAssetLucene
d’AEM doit être mis à jour afin de marquer les balises prédites (nom système des "balises intelligentes") comme partie de l’index Lucene agrégé de la ressource.
Sous /oak:index/damAssetLucene/indexRules/dam:Asset/properties/predicatedTags
, vérifiez que la configuration est la suivante :
<damAssetLucene jcr:primaryType="oak:QueryIndexDefinition">
<indexRules jcr:primaryType="nt:unstructured">
<dam:Asset jcr:primaryType="nt:unstructured">
<properties jcr:primaryType="nt:unstructured">
...
<predictedTags
jcr:primaryType="nt:unstructured"
isRegexp="{Boolean}true"
name="jcr:content/metadata/predictedTags/*/name"
useInSpellheck="{Boolean}true"
useInSuggest="{Boolean}true"
analyzed="{Boolean}true"
nodeScopeIndex="{Boolean}true"/>