使用AEM Assets设置智能翻译搜索

智能翻译搜索允许使用非英语搜索词解析为英语内容。 要为智能翻译搜索设置AEM,必须安装和配置Apache Oak Search Machine Translation OSGi捆绑包,以及包含翻译规则的相关免费和开放源Apache Joshua语言包。

注意

必须在每个需要智能翻译的AEM实例上设置智能翻译搜索。

  1. 下载并安装Oak Search Machine Translation OSGi捆绑包

  2. 下载和更新Apache Joshua语言包

    • 下载并解压缩所需的Apache Joshua语言包

    • 编辑joshua.config文件并注释掉以下2行开头:

      feature-function = LanguageModel ...
      
    • 确定并记录语言包的模型文件夹的大小,因为这会影响AEM需要多少额外的堆空间。

    • 将解压缩的Apache Joshua语言包文件夹(带有joshua.config编辑)移到

      .../crx-quickstart/opt/<source_language-target_language>
      

      例如:

       .../crx-quickstart/opt/es-en
      
  3. 使用更新的堆内存分配重新启动AEM

    • 停止AEM

    • 确定AEM所需的新堆大小

      • AEM prelanguage-lack堆大小+模型目录的大小舍入到最接近的2GB

      • 例如:如果AEM安装需要8GB的堆才能运行,而语言包的模型文件夹未压缩3.8GB,则新堆大小为:

        原始的8GB +(3.75GB向上舍入到最接近的2GB,即4GB),总计12GB

    • 验证计算机是否有此数量的额外可用内存。

    • 更新AEM开始脚本以调整新的堆大小

      • 例如. java -Xmx12g -jar cq-author-p4502.jar
    • 使用增加的堆大小重新启动AEM。

    注意

    语言包所需的堆空间可能会增大,尤其是当使用多语言包时。

    请务必确保​实例具有足够的内存​以适应已分配堆空间的增加。

    必须始终计算​基堆以支持可接受的性能,而不安装任何语言包

  4. 通过Apache Jackrabbit Oak Machine Translation全文查询条款提供商OSGi配置注册语言包

    • 对于每个语言包,通过AEM Web Console的“配置管理器”创建一个新的Apache Jackrabbit Oak机器翻译全文查询条款提供程序OSGi配置

      • Joshua Config Path 是joshua.config文件的绝对路径。AEM进程必须能够读取语言包文件夹中的所有文件。

      • Node types 是候选节点类型,其全文搜索将使用此语言包进行翻译。

      • Minimum score 是要使用的已翻译术语的最低置信度得分。

        • 例如,hombre(西班牙语为"man")可以译成置信度分数0.9的英文单词"man",也可以译成置信度分数0.2的英文单词"human"。 将最小得分调整为0.3将保留“hombre”到“man”的翻译,但将“hombre”转换为“human”,因为此0.2的翻译得分小于0.3的最小得分。
  5. 对资产执行全文搜索

    • 由于dam:Asset是此语言包已重新注册的节点类型,因此我们必须使用全文搜索搜索来搜索AEM Assets以验证此。
    • 导航到AEM >资产,然后打开Omnisearch。 搜索语言包已安装的语言的术语。
    • 根据需要,调整OSGi配置中的“最低得分”,以确保结果的准确性。
  6. 更新语言包

    • Apache Joshua语言包由Apache Joshua项目完整维护,其更新或更正由Apache Joshua项目自行决定。

    • 如果语言包已更新,为了在AEM中安装更新,必须执行上述步骤2 - 4,并根据需要调整堆大小。

      • 请注意,将解压缩的语言包移到crx-quickstart/opt文件夹时,请移动任何现有语言包文件夹,然后再复制到新文件夹中。
    • 如果AEM不需要重新启动,则必须重新保存与更新的语言包相关的相关Apache Jackrabbit Oak Machine翻译全文查询条款提供程序OSGi配置,以便AEM处理更新的文件。

正在更新damAssetLucene索引

为了使AEM智能标记受AEM智能翻译影响,必须更新AEM /oak :index /damAssetLucene索引以将预测的标记(“智能标记”的系统名称)标记为资产聚合Lucene索引的一部分。

/oak:index/damAssetLucene/indexRules/dam:Asset/properties/predicatedTags下,确保配置如下:

 <damAssetLucene jcr:primaryType="oak:QueryIndexDefinition">
        <indexRules jcr:primaryType="nt:unstructured">
            <dam:Asset jcr:primaryType="nt:unstructured">
                <properties jcr:primaryType="nt:unstructured">
                    ...
                    <predictedTags
                        jcr:primaryType="nt:unstructured"
                        isRegexp="{Boolean}true"
                        name="jcr:content/metadata/predictedTags/*/name"
                        useInSpellheck="{Boolean}true"
                        useInSuggest="{Boolean}true"
                        analyzed="{Boolean}true"
                        nodeScopeIndex="{Boolean}true"/>

其他资源

On this page

Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now