Désactivation de la recherche de texte intégral par type MIME avec configuration Tika personnalisée dans AEM

Cet article vous explique comment personnaliser la configuration de Tika pour désactiver la recherche de texte intégral en fonction des types MIME de fichiers.

Description description

Environnement

  • Adobe Experience Manager 6.1
  • Adobe Experience Manager 6.2
  • Adobe Experience Manager 6.3
  • Adobe Experience Manager 6.4

Problème/Symptômes

Comment désactiver la recherche de texte intégral par type MIME de fichier avec configuration Tika personnalisée dans Adobe Experience Manager (AEM).

Résolution resolution

Adobe recommande de désactiver la recherche de texte intégral pour les fichiers binaires via l’index Tika.

Pour plus d’informations sur les recommandations d’Adobe et sur l’optimisation des performances des ressources, reportez-vous à la section réglage des performances des ressources Article d’aide.

Solution 1 :

Pour répondre à la recommandation de l’Adobe, procédez comme suit :

  1. Installez le package fourni.

  2. Accédez aux emplacements suivants à l’aide de CRX/DE :

    • /oak:index/lucene/tika/config.xml
    • /oak:index/damAssetLucene/tika/config.xml
  3. Ajoutez le type MIME de fichier que vous souhaitez désactiver :

    • <mime>application/zip</mime>
  4. Enregistrez les modifications.

  5. Définissez la propriété booléenne refresh=true pour ces noeuds à l’aide de CRX/DE et enregistrez les modifications :

    • /oak:index/lucene

    • /oak:index/damAssetLucene

  6. Attendez les modifications mises à jour.

Solution 2 :

Pour une autre approche :

  1. Recherchez Oak-Lucene dans la console web d’AEM et notez le numéro de lot.
  2. Arrêtez l’instance AEM.
  3. Accédez à /crx-quickstart/launchpad/felix/bundlexxx répertoire .
  4. Accédez au sous-répertoire intitulé avec versionX.Y, par exemple felix/bundle102/version0.2 à l’aide de la fonction cdversion.
  5. Récupérez tout le contenu du fichier tika-config.xml à partir du fichier jar :
    • jar -xvf bundle.jar org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml
  6. Modifiez le fichier tika-config.xml :
    • vi org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml
  7. Par exemple, ajoutez le type MIME de fichier que vous souhaitez désactiver :
    • <mime>application/zip</mime>
  8. Enregistrez les modifications dans bundle.jar.
  9. Redémarrez AEM et vérifiez les modifications en recherchant des ressources de fichier zip.
recommendation-more-help
3d58f420-19b5-47a0-a122-5c9dab55ec7f