Die intelligente Übersetzungssuche ermöglicht die Verwendung von nicht englischen Suchbegriffen, um zu englischen Inhalten aufzulösen. Um AEM für die intelligente Übersetzungssuche einzurichten, müssen das OSGi-Bundle für die maschinelle Übersetzung von Apache Oak sowie die relevanten kostenlosen und Open-Source-Apache Joshua-Sprachpakete installiert und konfiguriert werden, die die Übersetzungsregeln enthalten.
Die intelligente Übersetzungssuche muss in jeder AEM Instanz eingerichtet werden, die sie benötigt.
Laden Sie das OSGi-Bundle Oak Search Machine Translation herunter und installieren Sie es.
/system/console/bundles
in AEM.Herunterladen und Aktualisieren der Sprachpakete für Apache Joshua
Laden Sie die gewünschten Apache Joshua Sprachpakete herunter und entpacken Sie sie.
Bearbeiten Sie die Datei joshua.config
und kommentieren Sie die zwei Zeilen aus, die mit beginnen:
feature-function = LanguageModel ...
Bestimmen und zeichnen Sie die Größe des Modellordners des Sprachpakets auf, da dies beeinflusst, wie viel zusätzlicher Heap-Speicherplatz AEM benötigt wird.
Verschieben Sie den entpackten Apache Joshua-Sprachpaketordner (mit den Änderungen joshua.config
) nach
.../crx-quickstart/opt/<source_language-target_language>
Beispiel:
.../crx-quickstart/opt/es-en
AEM mit aktualisierter Heap-Speicherzuordnung neu starten
Stoppen Sie AEM.
Bestimmen der neuen erforderlichen Heap-Größe für AEM
AEM Heap-Größe vor Sprachmangel + die Größe des Modellverzeichnisses, aufgerundet auf 2 GB
Beispiel: Wenn vorsprachige Packs für die AEM-Installation 8 GB Heap benötigen, um ausgeführt zu werden, und der Modellordner des Sprachpakets 3,8 GB unkomprimiert ist, lautet die neue Heap-Größe:
Das Original 8GB
+ ( 3.75GB
, auf das nächste 2GB
aufgerundet, was 4GB
ist) für insgesamt 12GB
Stellen Sie sicher, dass der Computer über diese Menge zusätzlichen Speicherplatzes verfügt.
Aktualisieren AEM Startskripte, um die neue Heap-Größe anzupassen
java -Xmx12g -jar cq-author-p4502.jar
Starten Sie AEM mit der erhöhten Heap-Größe neu.
Der benötigte Heap-Speicher für Sprachpakete kann groß werden, insbesondere wenn mehrere Sprachpakete verwendet werden.
Stellen Sie immer sicher, dass die Instanz über genügend Arbeitsspeicher verfügt, um die Zunahme des zugewiesenen Heap-Speicherplatzes zu berücksichtigen.
Der Basis-Heap muss immer so berechnet werden, dass eine akzeptable Leistung ohne installierte Sprachpakete gewährleistet ist.
Registrieren Sie die Sprachpakete über die OSGi-Konfigurationen des Apache Jackrabbit Oak Machine Translation (Volltext Query Term Provider).
Erstellen Sie für jedes Sprachpaket eine neue Apache Jackrabbit Oak Machine Translation-Volltext-Abfragebedingungen-Provider-OSGi-Konfiguration über den Configuration Manager der AEM Web Console.
Joshua Config Path
ist der absolute Pfad zur Datei "joshua.config". Der AEM muss alle Dateien im Ordner des Sprachpakets lesen können.
Node types
sind die Knotentypen für Kandidaten, deren Volltextsuche dieses Sprachpaket für die Übersetzung freigibt.
Minimum score
ist der minimale Konfidenzwert für einen übersetzten Begriff, der verwendet werden soll.
0.9
übersetzen und auch in das englische Wort "human"mit einem Konfidenzwert 0.2
übersetzen. Wenn Sie die Mindestpunktzahl auf 0.3
einstellen, bleibt die Übersetzung "hombre"zu "man" erhalten, aber die Übersetzung "hombre"zu "human"wird verworfen, da dieser Übersetzungswert von 0.2
kleiner als der Mindestwert von 0.3
ist.Durchführen einer Volltextsuche nach Assets
Aktualisieren von Sprachpaketen
Apache Joshua Sprachpakete werden vom Apache Joshua-Projekt in vollem Umfang gepflegt und ihre Aktualisierung oder Korrektur liegt im Ermessen des Apache Joshua-Projekts.
Wenn ein Sprachpaket aktualisiert wird, müssen zur Installation der Updates in AEM die obigen Schritte 2 bis 4 befolgt werden, wobei die Heap-Größe nach Bedarf nach oben oder unten angepasst werden muss.
Wenn AEM keinen Neustart erfordert, müssen die relevanten OSGi-Konfigurationen des Apache Jackrabbit Oak Machine Translation Fulltext Query Term Provider, die sich auf die aktualisierten Sprachpakete beziehen, erneut gespeichert werden, damit AEM die aktualisierten Dateien verarbeitet.
Damit AEM Smart-Tags von AEM Smart-Übersetzung betroffen sein können, muss der Index /oak :index /damAssetLucene
aktualisiert werden, um die predictedTags (den Systemnamen für "Smart-Tags") als Teil des Asset-Aggregat-Lucene-Index zu kennzeichnen.
Stellen Sie unter /oak:index/damAssetLucene/indexRules/dam:Asset/properties/predicatedTags
sicher, dass die Konfiguration wie folgt lautet:
<damAssetLucene jcr:primaryType="oak:QueryIndexDefinition">
<indexRules jcr:primaryType="nt:unstructured">
<dam:Asset jcr:primaryType="nt:unstructured">
<properties jcr:primaryType="nt:unstructured">
...
<predictedTags
jcr:primaryType="nt:unstructured"
isRegexp="{Boolean}true"
name="jcr:content/metadata/predictedTags/*/name"
useInSpellheck="{Boolean}true"
useInSuggest="{Boolean}true"
analyzed="{Boolean}true"
nodeScopeIndex="{Boolean}true"/>