Smart Translation Search permet d’utiliser des termes de recherche non anglais pour résoudre le problème en anglais. Pour configurer l'AEM pour Smart Translation Search, le lot OSGi de Apache Oak Search Machine Translation doit être installé et configuré, ainsi que les paquets de langues Apache Joshua gratuits et open source pertinents qui contiennent les règles de traduction.
La recherche de traduction intelligente doit être configurée sur chaque instance AEM qui en a besoin.
Téléchargement et installation du lot OSGi Oak Search Machine Translation
/system/console/bundles
.Téléchargement et mise à jour des modules linguistiques Apache Joshua
Téléchargez et décompressez les packs de langue Apache Joshua souhaités.
Modifiez le fichier joshua.config
et placez en commentaire les 2 lignes qui commencent par :
feature-function = LanguageModel ...
Déterminez et enregistrez la taille du dossier de modèles du module linguistique, car cela a une incidence sur la quantité d’espace de mémoire supplémentaire AEM nécessaire.
Déplacez le dossier Apache Joshua Language Pack décompressé (avec les joshua.config
modifications) vers
.../crx-quickstart/opt/<source_language-target_language>
Par exemple :
.../crx-quickstart/opt/es-en
Redémarrez AEM avec une allocation de mémoire de tas mise à jour
Arrêtez AEM
Déterminer la nouvelle taille de tas requise pour AEM
aem taille du tas de pré-langue sans mémoire + la taille du répertoire de modèles arrondi à 2 Go le plus proche
Par exemple : Si l’installation AEM des packs de prélangue nécessite 8 Go de tas pour être exécutée et que le dossier du modèle du pack de langue est de 3,8 Go non compressé, la nouvelle taille du tas est la suivante :
L'original 8GB
+ ( 3.75GB
arrondi au 2GB
le plus proche, qui est 4GB
) pour un total de 12GB
Vérifiez que la machine dispose de cette quantité de mémoire disponible.
Mettre à jour les scripts de début-up AEM pour les adapter à la nouvelle taille du tas
java -Xmx12g -jar cq-author-p4502.jar
Redémarrez l'AEM avec la taille du tas augmentée.
L’espace de mémoire requis pour les packs de langues peut s’agrandir, en particulier lorsque plusieurs packs de langues sont utilisés.
Veillez toujours à ce que l’instance ait suffisamment de mémoire pour s’adapter à l’augmentation de l’espace de tas alloué.
Le tas de base doit toujours être calculé pour prendre en charge des performances acceptables sans que des modules linguistiques ne soient installés.
Enregistrement des modules linguistiques via les configurations OSGi du fournisseur Apache Jackrabbit Oak Machine Translation Termes de Requête de texte intégral
Pour chaque module linguistique, créez une nouvelle configuration OSGi du fournisseur Apache Jackrabbit Oak Machine Translation Termes de Requête de texte intégral OSGi via le gestionnaire de configuration de la console Web AEM.
Joshua Config Path
est le chemin d’accès absolu au fichier joshua.config. Le processus AEM doit être en mesure de lire tous les fichiers du dossier du module linguistique.
Node types
sont les types de noeud candidats dont la recherche en texte intégral engage ce pack de langue pour la traduction.
Minimum score
est le score de confiance minimum pour un terme traduit à utiliser.
0.9
et par le mot anglais "humain" avec un score de confiance de 0.2
. Si vous définissez le score minimum sur 0.3
, vous conservez la traduction "hombre" à "man", mais vous ignorez la traduction "hombre" à "humain" car ce score de traduction de 0.2
est inférieur au score minimum de 0.3
.Exécution d’une recherche de texte intégral sur des fichiers
Mise à jour des packs de langues
Les modules linguistiques Apache Joshua sont entièrement conservés par le projet Apache Joshua, et leur mise à jour ou correction est laissée à la discrétion du projet Apache Joshua.
Si un pack de langue est mis à jour, pour installer les mises à jour dans AEM, les étapes 2 à 4 ci-dessus doivent être suivies, en ajustant la taille du tas vers le haut ou vers le bas si nécessaire.
Si AEM ne nécessite pas de redémarrage, alors la ou les configurations OSGi du fournisseur Apache Jackrabbit Oak Machien Translation Termes de Requête de traduction complète de Apache Jackrabbit doivent être réenregistrées afin que AEM traite les fichiers mis à jour.
Pour que AEM Balises dynamiques soit affecté par AEM Traduction dynamique, l'index /oak :index /damAssetLucene
de l'AEM doit être mis à jour afin de marquer les balises prédites (nom système des "Balises dynamiques") comme faisant partie de l'index Lucene de l'agrégat du fichier.
Sous /oak:index/damAssetLucene/indexRules/dam:Asset/properties/predicatedTags
, vérifiez que la configuration est la suivante :
<damAssetLucene jcr:primaryType="oak:QueryIndexDefinition">
<indexRules jcr:primaryType="nt:unstructured">
<dam:Asset jcr:primaryType="nt:unstructured">
<properties jcr:primaryType="nt:unstructured">
...
<predictedTags
jcr:primaryType="nt:unstructured"
isRegexp="{Boolean}true"
name="jcr:content/metadata/predictedTags/*/name"
useInSpellheck="{Boolean}true"
useInSuggest="{Boolean}true"
analyzed="{Boolean}true"
nodeScopeIndex="{Boolean}true"/>