Configuración de la búsqueda de traducción inteligente con AEM Assets set-up-smart-translation-search-with-aem-assets
La búsqueda inteligente de traducción permite el uso de términos de búsqueda que no estén en inglés para resolverlos en contenido en inglés. AEM Para configurar la para la búsqueda de traducción inteligente, se debe instalar y configurar el paquete OSGi de traducción automática de Apache Oak Search, así como los paquetes de idioma gratuitos y de código abierto pertinentes de Apache Joshua que contienen las reglas de traducción.
-
Descargue e instale el paquete OSGi de traducción automática de Oak Search
- Descargue el paquete OSGi de traducción automática de búsqueda Oak AEM que corresponde a la versión de Oak de la.
- AEM Instale el paquete OSGi de traducción automática de búsqueda de Oak descargado en la aplicación de correo electrónico de OSGi a través de la
/system/console/bundles
.
-
Descargar y actualizar los paquetes de idioma de Apache Joshua
-
Descargue y descomprima el archivo deseado Paquetes de idiomas de Apache Joshua.
-
Edite el
joshua.config
archivar y comentar las 2 líneas que comienzan por:code language-none feature-function = LanguageModel ...
-
AEM Determine y registre el tamaño de la carpeta del modelo del paquete de idioma, ya que esto influye en la cantidad de espacio de pila adicional que requerirá la aplicación de un módulo de almacenamiento de datos en un solo espacio de trabajo.
-
Mueva la carpeta del paquete de idioma Apache Joshua descomprimida (con el
joshua.config
ediciones) acode language-none .../crx-quickstart/opt/<source_language-target_language>
Por ejemplo:
code language-none .../crx-quickstart/opt/es-en
-
-
AEM Reiniciar con asignación de memoria de montón actualizada
-
AEM Detener la
-
AEM Determinar el nuevo tamaño de pila necesario para la
-
AEM Tamaño de pila de falta de idioma previo + el tamaño del directorio del modelo redondeado al 2 GB más cercano
-
AEM Por ejemplo: Si la instalación de paquetes de idioma previos requiere 8 GB de pila para ejecutarse y la carpeta del modelo del paquete de idioma tiene 3,8 GB sin comprimir, el nuevo tamaño de pila es:
El original
8GB
+ (3.75GB
redondeado hacia arriba al más cercano2GB
, que es4GB
) para un total de12GB
-
-
Compruebe que el equipo tiene esta cantidad de memoria disponible adicional.
-
AEM Actualizar scripts de inicio de la aplicación para ajustar el nuevo tamaño de la pila
- Ejemplo:
java -Xmx12g -jar cq-author-p4502.jar
- Ejemplo:
-
AEM Reinicie con el tamaño de pila aumentado.
note note NOTE El espacio de pila necesario para los paquetes de idioma puede aumentar, especialmente cuando se utilizan varios paquetes de idioma. Asegúrese siempre de la instancia tiene memoria suficiente para dar cabida a los incrementos en el espacio de pila asignado. El el montón base siempre se debe calcular para admitir un rendimiento aceptable sin ningún paquete de idioma instalado. -
-
Registre los paquetes de idiomas a través de Apache Jackrabbit Oak Traducción automática Términos de consulta de texto completo Proveedor Configuraciones OSGi
-
Para cada paquete de idioma, crear un nuevo Apache Jackrabbit Oak Traducción automática Consulta de texto completo Términos Proveedor Configuración OSGi AEM a través del administrador de configuración de la consola web de la.
-
Joshua Config Path
es la ruta absoluta al archivo joshua.config. AEM El proceso de la debe poder leer todos los archivos de la carpeta del paquete de idioma. -
Node types
son los tipos de nodo candidatos cuya búsqueda de texto completo involucrará a este paquete de idioma para su traducción. -
Minimum score
es la puntuación de confianza mínima para un término traducido para que se utilice.- Por ejemplo, hombre (hombre en español) puede traducirse a la palabra inglesa "man" con una puntuación de confianza de
0.9
y también traducir a la palabra "humano" con una puntuación de confianza0.2
. Ajuste de la puntuación mínima a0.3
, mantendría la traducción de "hombre" a "hombre", pero descartaría la traducción de "hombre" a "humano" ya que la puntuación de traducción de0.2
es menor que la puntuación mínima de0.3
.
- Por ejemplo, hombre (hombre en español) puede traducirse a la palabra inglesa "man" con una puntuación de confianza de
-
-
-
Realizar una búsqueda de texto completo en recursos
- Dado que dam: Asset es el tipo de nodo en el que se registra de nuevo este paquete de idioma, debemos buscar AEM Assets mediante la búsqueda de texto completo para validarlo.
- AEM Vaya a > Assets y abra Omnisearch. Busque un término en el idioma en el que se instaló el paquete de idioma.
- Si es necesario, ajuste la puntuación mínima en las configuraciones de OSGi para garantizar la precisión de los resultados.
-
Actualizar paquetes de idioma
-
Los paquetes de idiomas de Apache Joshua son mantenidos íntegramente por el proyecto Apache Joshua, y su actualización o corrección es a discreción del proyecto Apache Joshua.
-
AEM Si se actualiza un paquete de idioma, para instalar las actualizaciones en el, se deben seguir los pasos anteriores 2-4, ajustando el tamaño de la pila hacia arriba o hacia abajo según sea necesario.
- Tenga en cuenta que cuando mueva el paquete de idioma descomprimido a la carpeta crx-quickstart/opt, mueva cualquier carpeta de paquete de idioma existente antes de copiar la nueva.
-
AEM AEM Si no requiere un reinicio, las configuraciones relevantes del proveedor de términos de consulta de texto completo de Apache Jackrabbit Oak Machine que pertenecen a los paquetes de idiomas actualizados deben volver a guardarse para que procese los archivos actualizados, de modo que se procesen los archivos actualizados.
-
Actualizando el índice damAssetLucene updating-damassetlucene-index
Para que AEM Etiquetas inteligentes de la AEM AEM para verse afectado por la traducción inteligente de la, /oak :index /damAssetLucene
El índice debe actualizarse para marcar las etiquetas predichas (el nombre del sistema para "etiquetas inteligentes") para que formen parte del índice Lucene agregado del recurso.
En /oak:index/damAssetLucene/indexRules/dam:Asset/properties/predicatedTags
, asegúrese de que la configuración sea la siguiente:
<damAssetLucene jcr:primaryType="oak:QueryIndexDefinition">
<indexRules jcr:primaryType="nt:unstructured">
<dam:Asset jcr:primaryType="nt:unstructured">
<properties jcr:primaryType="nt:unstructured">
...
<predictedTags
jcr:primaryType="nt:unstructured"
isRegexp="{Boolean}true"
name="jcr:content/metadata/predictedTags/*/name"
useInSpellheck="{Boolean}true"
useInSuggest="{Boolean}true"
analyzed="{Boolean}true"
nodeScopeIndex="{Boolean}true"/>