使用AEM Assets設定智慧型翻譯搜尋 set-up-smart-translation-search-with-aem-assets

智慧型翻譯搜尋允許使用非英文搜尋詞來解析為英文內容。 若要為Smart Translation Search設定AEM,必須安裝和設定Apache Oak Search Machine Translation OSGi套件組合,以及包含翻譯規則的相關免費開放原始碼Apache Joshua語言套件。

NOTE
必須在每個需要智慧型翻譯搜尋的AEM執行個體上設定智慧型翻譯搜尋。
  1. 下載並安裝Oak搜尋機器翻譯OSGi套件

  2. 下載並更新Apache Joshua語言套件

    • 下載並解壓縮所需的Apache Joshua語言套件

    • 編輯joshua.config檔案,並註解開頭為的兩行:

      code language-none
      feature-function = LanguageModel ...
      
    • 判斷並記錄語言套件模型資料夾的大小,因為這會影響AEM所需的額外棧積空間。

    • 將解壓縮的Apache Joshua語言套件資料夾(包含joshua.config個編輯專案)移至

      code language-none
      .../crx-quickstart/opt/<source_language-target_language>
      

      例如:

      code language-none
       .../crx-quickstart/opt/es-en
      
  3. 使用更新的棧積記憶體配置重新啟動AEM

    • 停止AEM

    • 決定AEM所需的新棧積大小

      • AEM缺少語言前的棧積大小+模型目錄的大小四捨五入到最接近的2GB

      • 例如:如果AEM安裝需要執行8GB的棧集,而語言套件未壓縮的模型資料夾為3.8GB,則新的棧集大小為:

        原始8GB + ( 3.75GB舍入至最接近的2GB,即4GB),總計12GB

    • 確認電腦是否有此數量的額外可用記憶體。

    • 更新AEM啟動指令碼以調整新的棧積大小

      • 例如java -Xmx12g -jar cq-author-p4502.jar
    • 重新啟動AEM以增加棧積大小。

    note note
    NOTE
    語言套件所需的棧積空間可能會變得很大,尤其是使用多個語言套件時。
    請一律確定​ 執行個體有足夠的記憶體 ​來容納配置的棧積空間增加。
    必須一律計算​ 基底棧積以支援可接受的效能,而不安裝任何語言套件
  4. 透過Apache Jackrabbit Oak機器翻譯全文查詢條款提供者OSGi設定註冊語言套件

    • 針對每個語言套件,透過AEM Web Console的Configuration Manager建立新的Apache Jackrabbit Oak Machine Translation Full-text Query Terms Provider OSGi設定

      • Joshua Config Path是joshua.config檔案的絕對路徑。 AEM程式必須能夠讀取語言套件資料夾中的所有檔案。

      • Node types是候選節點型別,其全文檢索搜尋將與此語言套件互動以進行翻譯。

      • Minimum score是翻譯字詞要使用的信賴分數下限。

        • 例如,Hombre (西班牙文的「man」代表)可能會將信賴分數為0.9的英文單詞「man」翻譯成信賴分數為0.2的英文單詞「human」。 將最低分數調整為0.3會保留「hombre」到「man」的翻譯,但捨棄「hombre」到「human」的翻譯,因為此0.2的翻譯分數小於0.3的最低分數。
  5. 對資產執行全文搜尋

    • 由於dam:Asset是此語言套件再次註冊的節點型別,我們必須使用全文檢索搜尋來搜尋AEM Assets以驗證此功能。
    • 導覽至AEM > Assets並開啟Omnisearch。 搜尋已安裝語言套件之語言的辭彙。
    • 如有需要,請調整OSGi設定中的最低分數,以確保結果的準確性。
  6. 正在更新語言套件

    • Apache Joshua語言套件是由Apache Joshua專案所維護,其更新或更正由Apache Joshua專案自行決定。

    • 如果更新了語言套件,為了在AEM中安裝更新,必須執行上述步驟2到4,並視需要調整棧積大小。

      • 請注意,將解壓縮的語言套件移至crx-quickstart/opt資料夾時,請先移動任何現有的語言套件資料夾,然後再複製至新的語言套件。
    • 如果AEM不需要重新啟動,則必須重新儲存與更新語言套件相關的相關Apache Jackrabbit Oak機器翻譯全文查詢條款提供者OSGi設定,以便AEM處理更新的檔案。

更新damAssetLucene索引 updating-damassetlucene-index

為了讓AEM智慧標籤受到AEM智慧翻譯的影響,必須更新AEM /oak :index /damAssetLucene索引,以將predictedTags (「智慧標籤」的系統名稱)標示為資產彙總Lucene索引的一部分。

/oak:index/damAssetLucene/indexRules/dam:Asset/properties/predicatedTags底下,確定設定如下:

 <damAssetLucene jcr:primaryType="oak:QueryIndexDefinition">
        <indexRules jcr:primaryType="nt:unstructured">
            <dam:Asset jcr:primaryType="nt:unstructured">
                <properties jcr:primaryType="nt:unstructured">
                    ...
                    <predictedTags
                        jcr:primaryType="nt:unstructured"
                        isRegexp="{Boolean}true"
                        name="jcr:content/metadata/predictedTags/*/name"
                        useInSpellheck="{Boolean}true"
                        useInSuggest="{Boolean}true"
                        analyzed="{Boolean}true"
                        nodeScopeIndex="{Boolean}true"/>

其他資源 additional-resources

recommendation-more-help
a483189e-e5e6-49b5-a6dd-9c16d9dc0519