使用AEM Assets設定智慧型翻譯搜尋

上次更新: 2024-01-26
  • 主題:
  • Search
    檢視有關此主題的更多資訊
  • 建立對象:
  • Beginner
    Developer

智慧型翻譯搜尋允許使用非英文搜尋詞來解析為英文內容。 若要為Smart Translation Search設定AEM,必須安裝和設定Apache Oak Search Machine Translation OSGi套件組合,以及包含翻譯規則的相關免費開放原始碼Apache Joshua語言套件。

注意

必須在每個需要智慧型翻譯搜尋的AEM執行個體上設定智慧型翻譯搜尋。

  1. 下載並安裝Oak Search Machine Translation OSGi套件

  2. 下載並更新Apache Joshua語言套件

    • 下載並解壓縮所需的 Apache Joshua語言套件.

    • 編輯 joshua.config 將以下兩行作為開頭的檔案和註解:

      feature-function = LanguageModel ...
      
    • 判斷並記錄語言套件模型資料夾的大小,因為這會影響AEM所需的額外棧積空間。

    • 移動解壓縮的Apache Joshua語言套件資料夾(使用 joshua.config edites)至

      .../crx-quickstart/opt/<source_language-target_language>
      

      例如:

       .../crx-quickstart/opt/es-en
      
  3. 使用更新的棧積記憶體配置重新啟動AEM

    • 停止AEM

    • 決定AEM所需的新棧積大小

      • AEM pre-language-lack棧積大小+模型目錄的大小四捨五入到最接近的2GB

      • 例如:如果AEM安裝需要執行8GB的棧集,而語言套件未壓縮的模型資料夾為3.8GB,則新的棧集大小為:

        原始的 8GB + ( 3.75GB 四捨五入到最接近的值 2GB,也就是 4GB),總共 12GB

    • 確認電腦是否有此數量的額外可用記憶體。

    • 更新AEM啟動指令碼以調整新的棧積大小

      • 例如: java -Xmx12g -jar cq-author-p4502.jar
    • 重新啟動AEM以增加棧積大小。

    注意

    語言套件所需的棧積空間可能會變得很大,尤其是使用多個語言套件時。

    一律確定 執行個體有足夠的記憶體 以容納已配置棧積空間的增加。

    基礎棧積必須一律計算以支援可接受的效能,而不使用任何語言套件 已安裝。

  4. 透過Apache Jackrabbit Oak Machine Translation全文查詢條款提供者OSGi設定註冊語言套件

    • 對於每個語言套件, 建立新的Apache Jackrabbit Oak Machine Translation全文查詢條款提供者OSGi設定 透過AEM網頁主控台的Configuration manager。

      • Joshua Config Path 是joshua.config檔案的絕對路徑。 AEM程式必須能夠讀取語言套件資料夾中的所有檔案。

      • Node types 候選節點型別是否為全文檢索搜尋會與此語言套件互動以進行翻譯的節點。

      • Minimum score 是要使用的翻譯辭彙的最低信賴分數。

        • 例如,hombre (西班牙文中的「man」)可翻譯成英文單詞「man」,其信賴分數為 0.9 並加上信賴分數將之翻譯為「human」這個英文單詞 0.2. 將最低分數調整為 0.3,會保留「homre」到「man」的翻譯,但捨棄「homre」到「human」的翻譯,因為此翻譯分數為 0.2 小於的最低分數 0.3.
  5. 對資產執行全文搜尋

    • 由於dam:Asset是此語言套件再次註冊的節點型別,我們必須使用全文檢索搜尋來搜尋AEM Assets以驗證此功能。
    • 導覽至「AEM >資產」 ,然後開啟Omnisearch。 搜尋已安裝語言套件之語言的辭彙。
    • 如有需要,請調整OSGi設定中的最低分數,以確保結果的準確性。
  6. 正在更新語言套件

    • Apache Joshua語言套件是由Apache Joshua專案所維護,其更新或更正由Apache Joshua專案自行決定。

    • 如果更新了語言套件,為了在AEM中安裝更新,必須執行上述步驟2到4,並視需要調整棧積大小。

      • 請注意,將解壓縮的語言套件移至crx-quickstart/opt資料夾時,請先移動任何現有的語言套件資料夾,然後再複製至新的語言套件。
    • 如果AEM不需要重新啟動,則與更新語言套件相關的相關Apache Jackrabbit Oak Machine翻譯全文查詢條款提供者OSGi設定必須重新儲存,以便AEM處理更新的檔案。

更新damAssetLucene索引

為了 AEM智慧標籤 將受AEM Smart Translation影響,AEM /oak :index /damAssetLucene 必須更新索引,才能將predictedTags (「智慧標籤」的系統名稱)標示為資產彙總Lucene索引的一部分。

/oak:index/damAssetLucene/indexRules/dam:Asset/properties/predicatedTags,確認設定如下:

 <damAssetLucene jcr:primaryType="oak:QueryIndexDefinition">
        <indexRules jcr:primaryType="nt:unstructured">
            <dam:Asset jcr:primaryType="nt:unstructured">
                <properties jcr:primaryType="nt:unstructured">
                    ...
                    <predictedTags
                        jcr:primaryType="nt:unstructured"
                        isRegexp="{Boolean}true"
                        name="jcr:content/metadata/predictedTags/*/name"
                        useInSpellheck="{Boolean}true"
                        useInSuggest="{Boolean}true"
                        analyzed="{Boolean}true"
                        nodeScopeIndex="{Boolean}true"/>

其他資源

本頁內容