Tika設定在AEMaaCS-Assets中無法運作

在AEMaaCS Assets中,雲端環境中會忽略自訂Tika設定(例如排除PDF),預設為立即可用(OOTB)設定。 若要修正此問題,請從damAssetLucene索引中移除「彙總」子句,或在處理之後刪除/jcr:content/renditions/cqdam.text.txt節點。

說明 description

環境

  • 產品: Adobe Experience Manager as a Cloud Service (AEMaaCS) - Assets
  • 例項:開發

問題/症狀

  • 自訂Lucene索引包含特定屬性和自訂Apache Tika設定。
  • Tika設定從索引和搜尋中排除某些資產型別(例如PDF)。
  • 安裝程式在本機環境中可正常運作。
  • 雲端環境會忽略自訂Tika設定。
  • 系統預設為立即可用(OOTB) Tika設定。
  • 記錄訊息會確認正在載入預設Tika設定,而非自訂設定。

解決方法 resolution

若要修正此問題,請遵循下列步驟:

  • 修改DAM索引定義

    1. 開啟damAssetLucene索引定義。 如需詳細資訊,請參閱有關內容搜尋和索引的AEM檔案
    2. 移除以文字轉譯路徑(/jcr:content/renditions/cqdam.text.txt)為目標的彙總子句,以從全文檢索搜尋排除擷取的文字。
  • 實施後處理工作流程

    1. 建立在AEM服務完成處理後執行的自訂Asset Compute工作流程。

    2. 在工作流程中:

      • 新增步驟以刪除/jcr:content/renditions/cqdam.text.txt節點。
      • 或者,將節點取代為空白檔案,以防止為其編制索引。
    3. 使用Cloud Manager部署工作流程並進行測試,以確認不要的文字索引已被抑制。

附註:

  • 在本機/AEM SDK中,Tika設定會直接影響二進位內容(例如PDF、PNG、MP4)的索引方式。 使用定義的Tika設定,在相同執行階段內進行索引。
  • 在AEM as a Cloud Service中,Asset Compute服務會處理來自二進位檔的文字和中繼資料擷取。 然後,將此擷取的資料提供給DAM索引。 Tika的OSGi設定不會影響此程式。
  • 您無法使用本機Tika設定覆寫或自訂雲端中二進位檔的全文擷取。 Tika的設定只會影響AEM SDK中的本機轉譯,以及部分舊版內部部署的設定。

閱讀讀數

在AEM Assets教學課程中自訂後續處理工作流程

recommendation-more-help
3d58f420-19b5-47a0-a122-5c9dab55ec7f