在AEM中使用自定义Tika配置禁用按MIME类型进行全文搜索

本文介绍如何自定义Tika配置以基于文件mime类型禁用全文搜索。

描述 description

环境

  • Adobe Experience Manager 6.1
  • Adobe Experience Manager 6.2
  • Adobe Experience Manager 6.3
  • Adobe Experience Manager 6.4

问题/症状

如何在Adobe Experience Manager (AEM)中使用自定义Tika配置禁用按文件mime类型进行全文搜索。

解决方法 resolution

Adobe建议通过Tika索引禁用二进制文件的全文搜索。

有关Adobe推荐以及如何优化资产性能的更多详细信息,请参阅 资源性能调整 帮助文章。

解决方案1:

要处理Adobe的建议,请执行以下步骤:

  1. 安装提供的包。

  2. 使用CRX/DE导航到以下位置:

    • /oak:index/lucene/tika/config.xml
    • /oak:index/damAssetLucene/tika/config.xml
  3. 添加要禁用的mime类型文件:

    • <mime>application/zip</mime>
  4. 保存更改。

  5. 使用CRX/DE为这些节点设置布尔属性refresh=true ,并保存更改:

    • /oak:index/lucene

    • /oak:index/damAssetLucene

  6. 等待更新的更改。

解决方案2:

对于替代方法:

  1. 搜索 Oak-Lucene 在AEM Web控制台中,并记下捆绑包编号。
  2. 关闭AEM实例。
  3. 导航到 /crx-quickstart/launchpad/felix/bundlexxx 目录。
  4. 转到标记为versionX.Y的子目录,如使用 cd版本。
  5. 从jar文件中检索tika-config.xml文件的所有内容:
    • jar -xvf bundle.jar org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml
  6. 编辑tika-config.xml文件:
    • vi org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml
  7. 例如,添加要禁用的mime类型文件:
    • <mime>application/zip</mime>
  8. 将更改保存到bundle.jar。
  9. 重新启动AEM,并通过搜索zip文件资源来验证更改。
recommendation-more-help
3d58f420-19b5-47a0-a122-5c9dab55ec7f