使用AEM Assets設定智慧型翻譯搜尋 set-up-smart-translation-search-with-aem-assets
智慧型翻譯搜尋允許使用非英文搜尋詞來解析為英文內容。 若要為Smart Translation Search設定AEM,必須安裝和設定Apache Oak Search Machine Translation OSGi套件組合,以及包含翻譯規則的相關免費開放原始碼Apache Joshua語言套件。
-
下載並安裝Oak搜尋機器翻譯OSGi套件
- 下載對應至AEM Oak版本的Oak Search Machine Translation OSGi套件。
- 透過
/system/console/bundles
將下載的Oak Search Machine Translation OSGi套件組合安裝至AEM。
-
下載並更新Apache Joshua語言套件
-
下載並解壓縮所需的Apache Joshua語言套件。
-
編輯
joshua.config
檔案,並註解開頭為的兩行:code language-none feature-function = LanguageModel ...
-
判斷並記錄語言套件模型資料夾的大小,因為這會影響AEM所需的額外棧積空間。
-
將解壓縮的Apache Joshua語言套件資料夾(包含
joshua.config
個編輯專案)移至code language-none .../crx-quickstart/opt/<source_language-target_language>
例如:
code language-none .../crx-quickstart/opt/es-en
-
-
使用更新的棧積記憶體配置重新啟動AEM
-
停止AEM
-
決定AEM所需的新棧積大小
-
AEM缺少語言前的棧積大小+模型目錄的大小四捨五入到最接近的2GB
-
例如:如果AEM安裝需要執行8GB的棧集,而語言套件未壓縮的模型資料夾為3.8GB,則新的棧集大小為:
原始
8GB
+ (3.75GB
舍入至最接近的2GB
,即4GB
),總計12GB
-
-
確認電腦是否有此數量的額外可用記憶體。
-
更新AEM啟動指令碼以調整新的棧積大小
- 例如
java -Xmx12g -jar cq-author-p4502.jar
- 例如
-
重新啟動AEM以增加棧積大小。
note note NOTE 語言套件所需的棧積空間可能會變得很大,尤其是使用多個語言套件時。 請一律確定 執行個體有足夠的記憶體 來容納配置的棧積空間增加。 必須一律計算 基底棧積以支援可接受的效能,而不安裝任何語言套件。 -
-
透過Apache Jackrabbit Oak機器翻譯全文查詢條款提供者OSGi設定註冊語言套件
-
-
Joshua Config Path
是joshua.config檔案的絕對路徑。 AEM程式必須能夠讀取語言套件資料夾中的所有檔案。 -
Node types
是候選節點型別,其全文檢索搜尋將與此語言套件互動以進行翻譯。 -
Minimum score
是翻譯字詞要使用的信賴分數下限。- 例如,Hombre (西班牙文的「man」代表)可能會將信賴分數為
0.9
的英文單詞「man」翻譯成信賴分數為0.2
的英文單詞「human」。 將最低分數調整為0.3
會保留「hombre」到「man」的翻譯,但捨棄「hombre」到「human」的翻譯,因為此0.2
的翻譯分數小於0.3
的最低分數。
- 例如,Hombre (西班牙文的「man」代表)可能會將信賴分數為
-
-
-
對資產執行全文搜尋
- 由於dam:Asset是此語言套件再次註冊的節點型別,我們必須使用全文檢索搜尋來搜尋AEM Assets以驗證此功能。
- 導覽至AEM > Assets並開啟Omnisearch。 搜尋已安裝語言套件之語言的辭彙。
- 如有需要,請調整OSGi設定中的最低分數,以確保結果的準確性。
-
正在更新語言套件
-
Apache Joshua語言套件是由Apache Joshua專案所維護,其更新或更正由Apache Joshua專案自行決定。
-
如果更新了語言套件,為了在AEM中安裝更新,必須執行上述步驟2到4,並視需要調整棧積大小。
- 請注意,將解壓縮的語言套件移至crx-quickstart/opt資料夾時,請先移動任何現有的語言套件資料夾,然後再複製至新的語言套件。
-
如果AEM不需要重新啟動,則必須重新儲存與更新語言套件相關的相關Apache Jackrabbit Oak機器翻譯全文查詢條款提供者OSGi設定,以便AEM處理更新的檔案。
-
更新damAssetLucene索引 updating-damassetlucene-index
為了讓AEM智慧標籤受到AEM智慧翻譯的影響,必須更新AEM /oak :index /damAssetLucene
索引,以將predictedTags (「智慧標籤」的系統名稱)標示為資產彙總Lucene索引的一部分。
在/oak:index/damAssetLucene/indexRules/dam:Asset/properties/predicatedTags
底下,確定設定如下:
<damAssetLucene jcr:primaryType="oak:QueryIndexDefinition">
<indexRules jcr:primaryType="nt:unstructured">
<dam:Asset jcr:primaryType="nt:unstructured">
<properties jcr:primaryType="nt:unstructured">
...
<predictedTags
jcr:primaryType="nt:unstructured"
isRegexp="{Boolean}true"
name="jcr:content/metadata/predictedTags/*/name"
useInSpellheck="{Boolean}true"
useInSuggest="{Boolean}true"
analyzed="{Boolean}true"
nodeScopeIndex="{Boolean}true"/>