AEMのカスタム Tika 設定を使用した MIME タイプによるフルテキスト検索の無効化

この記事では、Tika 設定をカスタマイズして、ファイルの MIME タイプに基づいて全文検索を無効にする方法を説明します。

説明 description

環境

  • Adobe Experience Manager 6.1
  • Adobe Experience Manager 6.2
  • Adobe Experience Manager 6.3
  • Adobe Experience Manager 6.4

問題/症状

Adobe Experience Manager(AEM)でカスタム Tika 設定を使用して、ファイル MIME タイプによる全文検索を無効にする方法を説明します。

解決策 resolution

Adobeは、Tika インデックスを使用してバイナリファイルの全文検索を無効にすることをお勧めします。

Adobeの推奨事項とアセットのパフォーマンスを最適化する方法について詳しくは、asset performance tuning Helpx」を参照してください。

解決策 1:

Adobeの推奨事項に対処するには、次の手順に従います。

  1. 提供されたパッケージをインストールします。

  2. CRX/DE を使用して次の場所に移動します。

    • /oak:index/lucene/tika/config.xml
    • /oak:index/damAssetLucene/tika/config.xml
  3. 無効にするファイルの MIME タイプを追加します。

    • <mime>application/zip</mime>
  4. 変更内容を保存します。

  5. CRX/DE を使用してこれらのノードのブール値プロパティ refresh=true を設定し、変更内容を保存します。

    • /oak:index/lucene

    • /oak:index/damAssetLucene

  6. 更新された変更を待ちます。

解決策 2:

代替アプローチの場合:

  1. AEM web コンソールで 0}Oak-Lucene} を検索し、バンドル番号をメモします。
  2. AEM インスタンスをシャットダウンします。
  3. ディレクトリに移動 /crx-quickstart/launchpad/felix/bundlexxx ます。
  4. cdversion を使用して、felix/bundle102/version0.2 のように、versionX.Y のラベルが付いたサブディレクトリに移動します。
  5. jar ファイルから tika-config.xml ファイルのすべてのコンテンツを取得します。
    • jar -xvf bundle.jar org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml
  6. tika-config.xml ファイルを編集します。
    • vi org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml
  7. 例えば、無効にするファイルの MIME タイプを追加します。
    • <mime>application/zip</mime>
  8. 変更内容を bundle.jar に保存します。
  9. AEMを再起動し、zip ファイルアセットを検索して、変更を確認します。
recommendation-more-help
3d58f420-19b5-47a0-a122-5c9dab55ec7f