关于单词和语言

可使用Words & Language确定如何将搜索词与网页内容进行匹配。

使用单词和语言

在Words & Language设置的效果可用于站点访客之前,包括您对这些设置所做的任何更改,必须重新生成站点索引。 与索引不同,重新生成不涉及搜索网页,只需几秒钟。

配置搜索词与Web内容的匹配方式

您可以使用“单词和语言”来确定网站搜索/促销如何将搜索词与网页内容匹配。

配置搜索词与Web内容的匹配方式

  1. 在产品菜单上,单击​Linguistics > Words & Language

  2. 在Words & Languages页面上,设置所需的选项。

    选项

    描述

    区分大小写

    默认情况下未选中。

    确定是否区分大写字母与小写字母。 例如,选择“成功”时,会将“成功”与“成功”区分开来,并且搜索结果可能会在两者之间有所不同。

    音符

    默认选中。

    确定是否将包含变音符的词与不包含变音符的词区分开。 例如,当选择时,“pagina”与“página”区分开。 如果您的网站使用非英语语言,请取消选择此选项。

    数字

    默认选中。

    确定是否对包含数字的词进行索引。

    忽略撇号

    默认情况下未选中。

    撇号将从查询中删除。 例如,搜索“树”将返回与搜索“树”相同的结果。

    忽略连字符

    默认情况下未选中。

    从查询中删除连字符。 例如,搜索“blue-bell”将返回与搜索“bluebell”相同的结果。

    部分字母数字匹配

    默认情况下未选中。

    选择此选项后,您可以在字母数字过渡上拆分令牌,以允许部分或产品令牌上的自由文本匹配。

    例如,假定网站上一个或多个页面的正文内容中有一个产品标识符 910XT 。 当此选项被选中时,在搜索 910XT 时,AdobeSearch&Promote会查找此产品标识符的匹配项。 在“搜索连接 — Div — 启用”打开的情况下,AdobeSearch&Promote还会找到 910 XT 。 但是,它不会只找到 910 XT 的实例。

    当您选择部分字母数字匹配时,索引器会将这些混合字母数字令牌分为多个令牌。 例如,将产品标识符(如 XYZ123 )索引到三个令牌中: XYZ123 XYZ 123 。 此类功能允许在任何这些变体上进行搜索时自由文本匹配。

    在另一个示例中,假设您具有产品标识符 AB910XT 。 如果选择部分字母数字匹配 已打开搜索连接 — Div — 启用,AdobeSearch&Promote将其索引为 AB910XT AB 910 XT 。 然后,例如,当用户搜索 910XT 时,搜索会扩展以同时查找 910XT 910 XT 的实例。

    注意: 默认情况下,未启用搜索连接 — Div — 启用。 请联系技术支持以激活该功能以供您使用。

    注意: 部分字母数字匹配将全局应用于所有索引字段。 但是,它只影响自由文本匹配;它不会影响精确匹配或范围匹配。

    相似声音匹配

    默认选中。

    声音相似的词语是相配的,如"健康"和"健康"。 尽管拼写错误,但客户仍可轻松搜索。

    备用字Forms

    默认值为默认备用字Forms

    您可以在“替代单词Forms”下拉列表中从以下选项中进行选择:

    • None

      在索引过程中不应用词干或替代词表单。

    • 默认替代字Forms

      在索引过程中会自动完成词干。

    • 域词典

      您设置为词干词典的任何域词典都将用作替代词形的源。

      请参阅关于字典

      请参阅将词典配置为词干词典

    如果在AdobeSearch&Promote中启用了短语词干,请注意,短语中也会出现替代词形式。

    请参阅Search&Promote8.15.0发行说明(6/19/2014)

    语言

    默认值为英语(美国)

    所选语言确保根据世界所选部分使用的惯例分析日期和数值。

    替代单词Forms 设置为默认替代单词Forms 或设置为域词典时,单词形式和词尾会根据所选语言的语言规则而改变。

    默认情况下,“语言”设置不用于确定从您的网站读取的页面的语言。 读取页面的语言由其HTTP头或页面本身的元标记确定。 您的网站可能包含多种不同语言的页面。 无论此处选择的语言如何,都可以正确阅读和索引每个页面。

    如果对网站上的某些页面使用Unicode字符集编码(如UTF-8),请确保正确指定了这些页面的语言。 如果Unicode文档不存在相应的HTTP头或元标记,则可以使用设置 > 元数据 > 注入来指定相应的语言。

    选中应用于没有指定语言的文档? 对从您的网站读取的没有明确设置的页面使用语言设置。当您的文档中只有某些没有语言设置时,请使用此设置。 如果您的文档的没有具有语言设置,或者受影响的文档集是众所周知且可管理的小列表,请使用设置 > 元数据 > 注入

    请参阅关于Injections

    使用反编译器?

    注意: 此功能仅用于丹麦语和德语。 此外,默认情况下不启用此功能。 请联系技术支持以激活该功能以供您使用。 启用后,使用Decompounder? 选项仅在您从此表前面所述的“语 言”下 式列表 中选 择丹麦语或德 语时才显示在用户界面中。

    当您选择使用Decompounder时? ,该服务将丹麦语或德语复合词分解,允许在原始复合词的同时索引组件词。

    要了解此功能的工作方式,请在文本字段中输入单词,然后单击测试

  3. 单击 Save Settings.

  4. 要预览更改的结果,请单击​regenerate your staged site index​以重新构建分阶段网站索引。

  5. (可选)执行下列操作之一:

On this page

Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now