La búsqueda de traducción inteligente permite el uso de términos de búsqueda que no estén en inglés para resolver el contenido en inglés. Para configurar AEM para la búsqueda de traducción inteligente, debe instalarse y configurarse el paquete OSGi de traducción de Apache Oak Search Machine, así como los paquetes de idioma Apache Joshua de código abierto y gratuito que contengan las reglas de traducción.
La búsqueda de traducción inteligente debe configurarse en cada instancia de AEM que la requiera.
Descargue e instale el paquete OSGi Oak Search Machine Translation
/system/console/bundles
.Descargar y actualizar los paquetes de idioma de Apache Joshua
Descargue y descomprima los paquetes de idioma Apache Joshua deseados.
Edite el archivo joshua.config
y comente las dos líneas que comienzan por:
feature-function = LanguageModel ...
Determine y registre el tamaño de la carpeta modelo del paquete de idioma, ya que esto influye en el espacio adicional que AEM necesitará.
Mover la carpeta del paquete de idioma Apache Joshua descomprimido (con las joshua.config
ediciones) a
.../crx-quickstart/opt/<source_language-target_language>
Por ejemplo:
.../crx-quickstart/opt/es-en
Reiniciar AEM con asignación de memoria de pila actualizada
Detener AEM
Determine el nuevo tamaño de pila necesario para AEM
El tamaño de pila de falta de lenguaje previo de AEM + el tamaño del directorio del modelo redondeado hasta los 2 GB más cercanos
Por ejemplo: Si los paquetes de idiomas previos a la instalación de AEM requieren 8 GB de memoria para ejecutarse y la carpeta modelo del paquete de idioma es de 3,8 GB sin comprimir, el nuevo tamaño de pila es:
El 8GB
+ ( 3.75GB
original redondeado a la 2GB
más cercana, que es 4GB
) para un total de 12GB
Verifique que el equipo tenga esta cantidad de memoria disponible adicional.
Actualice los scripts de inicio de AEM para ajustar el nuevo tamaño de pila
java -Xmx12g -jar cq-author-p4502.jar
Reinicie AEM con el tamaño de pila aumentado.
El espacio de memoria necesario para los paquetes de idiomas puede crecer, especialmente cuando se utilizan varios paquetes de idiomas.
Asegúrese siempre de que la instancia tenga suficiente memoria para dar cabida a los incrementos en el espacio asignado.
La pila base siempre debe calcularse para soportar un rendimiento aceptable sin ningún paquete de idioma instalado.
Registre los paquetes de idiomas a través de las configuraciones OSGi del proveedor de términos de consulta de texto completo de Apache Jackrabbit Oak Machine Translation
Para cada paquete de idioma, cree una nueva configuración OSGi del proveedor de términos de consulta de texto completo Apache Jackrabbit Oak Machine Translation a través del administrador de configuración de la consola web de AEM.
Joshua Config Path
es la ruta absoluta al archivo joshua.config. El proceso AEM debe poder leer todos los archivos de la carpeta del paquete de idioma.
Node types
son los tipos de nodos candidatos cuya búsqueda de texto completo atraerá este paquete de idioma para su traducción.
Minimum score
es la puntuación de confianza mínima para un término traducido que se utilizará.
0.9
y también traducirse a la palabra en inglés "human" con una puntuación de confianza 0.2
. Si se ajusta la puntuación mínima a 0.3
, se conservaría el "hombre" en la traducción "hombre", pero se descartaría el "hombre" en la traducción "humana", ya que esta puntuación de traducción de 0.2
es inferior a la puntuación mínima de 0.3
.Realizar una búsqueda de texto completo con recursos
Actualización de paquetes de idiomas
Los paquetes de idioma Apache Joshua están totalmente mantenidos por el proyecto Apache Joshua, y su actualización o corrección es discreción del proyecto Apache Joshua.
Si se actualiza un paquete de idioma, para instalar las actualizaciones en AEM, deben seguirse los pasos 2 a 4 anteriores, ajustando el tamaño de pila hacia arriba o hacia abajo según sea necesario.
Si AEM no requiere un reinicio, entonces las configuraciones OSGi del proveedor de términos de consulta de texto completo de Apache Jackrabbit Oak Machien relevantes relacionadas con los paquetes de idioma actualizados deben volver a guardarse para que AEM procese los archivos actualizados.
Para que AEM Smart Tags se vean afectados por la traducción inteligente de AEM, el índice /oak :index /damAssetLucene
de AEM debe actualizarse para marcar las etiquetas predichas (el nombre del sistema para "etiquetas inteligentes") para que formen parte del índice Lucene agregado del recurso.
En /oak:index/damAssetLucene/indexRules/dam:Asset/properties/predicatedTags
, asegúrese de que la configuración sea la siguiente:
<damAssetLucene jcr:primaryType="oak:QueryIndexDefinition">
<indexRules jcr:primaryType="nt:unstructured">
<dam:Asset jcr:primaryType="nt:unstructured">
<properties jcr:primaryType="nt:unstructured">
...
<predictedTags
jcr:primaryType="nt:unstructured"
isRegexp="{Boolean}true"
name="jcr:content/metadata/predictedTags/*/name"
useInSpellheck="{Boolean}true"
useInSuggest="{Boolean}true"
analyzed="{Boolean}true"
nodeScopeIndex="{Boolean}true"/>