Desactivación de la búsqueda de texto completo por tipo de mime con la configuración personalizada de Tika en AEM
Este artículo le explicará cómo personalizar la configuración de Tika para deshabilitar la búsqueda de texto completo en función de los tipos de MIME de archivo.
Descripción
Entorno
- Adobe Experience Manager 6.1
- Adobe Experience Manager 6.2
- Adobe Experience Manager 6.3
- Adobe Experience Manager 6.4
Problema/Síntomas
Cómo deshabilitar la búsqueda de texto completo por tipo de mime de archivo con la configuración personalizada Tika en Adobe Experience Manager (AEM).
Resolución
Adobe recomienda deshabilitar la búsqueda de texto completo para archivos binarios a través del índice Tika.
Solución 1:
Para abordar la recomendación de Adobe, siga estos pasos:
-
Instale el paquete proporcionado.
-
Vaya a las siguientes ubicaciones con CRX/DE:
/oak:index/lucene/tika/config.xml
/oak:index/damAssetLucene/tika/config.xml
-
Añada el tipo de mime del archivo que desea desactivar:
<mime>application/zip</mime>
-
Guarde los cambios.
-
Establezca la propiedad booleana refresh=true para estos nodos usando CRX/DE y guarde los cambios:
-
/oak:index/lucene
-
/oak:index/damAssetLucene
-
-
Espere a que se actualicen los cambios.
Solución 2:
Para un enfoque alternativo:
- Busque Oak-Lucene en la consola web de AEM y anote el número de paquete.
- Cierre la instancia de AEM.
- Vaya al directorio
/crx-quickstart/launchpad/felix/bundlexxx
. - Vaya al subdirectorio etiquetado con versionX.Y, como felix/bundle102/version0.2, usando la
cd
versión. - Recupere todo el contenido del archivo tika-config.xml del archivo jar:
jar -xvf bundle.jar org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml
- Edite el archivo tika-config.xml:
vi org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml
- Por ejemplo, añada el tipo de mime del archivo que desea desactivar:
<mime>application/zip</mime>
- Guardar cambios en bundle.jar.
- Reinicie AEM y compruebe los cambios buscando recursos de archivo zip.