在AEM中使用自定义Tika配置禁用按MIME类型进行全文搜索

本文介绍如何自定义Tika配置以基于文件mime类型禁用全文搜索。

描述 description

环境

  • Adobe Experience Manager 6.1
  • Adobe Experience Manager 6.2
  • Adobe Experience Manager 6.3
  • Adobe Experience Manager 6.4

问题/症状

如何在Adobe Experience Manager (AEM)中使用自定义Tika配置禁用按文件mime类型进行全文搜索。

解决方法 resolution

Adobe建议通过Tika索引禁用二进制文件的全文搜索。

有关Adobe建议以及如何优化资源性能的详细信息,请参阅资源性能优化帮助文章。

解决方案1:

要处理Adobe的建议,请执行以下步骤:

  1. 安装提供的包。

  2. 使用CRX/DE导航到以下位置:

    • /oak:index/lucene/tika/config.xml
    • /oak:index/damAssetLucene/tika/config.xml
  3. 添加要禁用的mime类型文件:

    • <mime>application/zip</mime>
  4. 保存更改。

  5. 使用CRX/DE为这些节点设置布尔值属性refresh=true ,并保存更改:

    • /oak:index/lucene

    • /oak:index/damAssetLucene

  6. 等待更新的更改。

解决方案2:

对于替代方法:

  1. 在AEM Web控制台中搜索​ Oak-Lucene,并记下捆绑包编号。
  2. 关闭AEM实例。
  3. 导航到/crx-quickstart/launchpad/felix/bundlexxx目录。
  4. 转到标记为versionX.Y的子目录,如使用cd版本的felix/bundle102/version0.2。
  5. 从jar文件中检索tika-config.xml文件的所有内容:
    • jar -xvf bundle.jar org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml
  6. 编辑tika-config.xml文件:
    • vi org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml
  7. 例如,添加要禁用的mime类型文件:
    • <mime>application/zip</mime>
  8. 将更改保存到bundle.jar。
  9. 重新启动AEM,并通过搜索zip文件资源来验证更改。
recommendation-more-help
3d58f420-19b5-47a0-a122-5c9dab55ec7f