关于单词和语言

可使用Words & Language确定如何将搜索词与网页内容进行匹配。

使用单词和语言

在Words & Language设置的效果可用于站点访客之前,包括您对这些设置所做的任何更改,必须重新生成站点索引。 与索引不同,重新生成不涉及搜索网页,只需几秒钟。

配置搜索词与Web内容的匹配方式

您可以使用“单词和语言”来确定网站搜索/促销如何将搜索词与网页内容匹配。

配置搜索词与Web内容的匹配方式

  1. 在产品菜单上,单击​Linguistics > Words & Language

  2. 在Words & Languages页面上,设置所需的选项。

    选项

    描述

    区分大小写

    默认情况下未选中。

    确定是否区分大写字母与小写字母。 例如,选择“成功”时,会将“成功”与“成功”区分开来,并且搜索结果可能会在两者之间有所不同。

    音符

    默认选中。

    确定是否将包含变音符的词与不包含变音符的词区分开。 例如,当选择时,“pagina”与“página”区分开。 如果您的网站使用非英语语言,请取消选择此选项。

    数字

    默认选中。

    确定是否对包含数字的词进行索引。

    忽略撇号

    默认情况下未选中。

    撇号将从查询中删除。 例如,搜索“树”将返回与搜索“树”相同的结果。

    忽略连字符

    默认情况下未选中。

    从查询中删除连字符。 例如,搜索“blue-bell”将返回与搜索“bluebell”相同的结果。

    部分字母数字匹配

    默认情况下未选中。

    选择此选项后,您可以在字母数字过渡上拆分令牌,以允许部分或产品令牌上的自由文本匹配。

    例如,假定网站上一个或多个页面的正文内容中有一个产品标识符 910XT 。 当此选项被选中时,在搜索 910XT 时,AdobeSearch&Promote会查找此产品标识符的匹配项。 在“搜索连接 — Div — 启用”打开的情况下,AdobeSearch&Promote还会找到 910 XT 。 但是,它不会只找到 910 XT 的实例。

    当您选择部分字母数字匹配时,索引器会将这些混合字母数字令牌分为多个令牌。 例如,将产品标识符(如 XYZ123 )索引到三个令牌中: XYZ123 XYZ 123 。 此类功能允许在任何这些变体上进行搜索时自由文本匹配。

    在另一个示例中,假设您具有产品标识符 AB910XT 。 如果选择部分字母数字匹配 已打开搜索连接 — Div — 启用,AdobeSearch&Promote将其索引为 AB910XT AB 910 XT 。 然后,例如,当用户搜索 910XT 时,搜索会扩展以同时查找 910XT 910 XT 的实例。

    注意: 默认情况下,未启用搜索连接 — Div — 启用。 请联系技术支持以激活该功能以供您使用。

    注意: 部分字母数字匹配将全局应用于所有索引字段。 但是,它只影响自由文本匹配;它不会影响精确匹配或范围匹配。

    相似声音匹配

    默认选中。

    声音相似的词语是相配的,如"健康"和"健康"。 尽管拼写错误,但客户仍可轻松搜索。

    备用字Forms

    默认值为默认备用字Forms

    您可以在“替代单词Forms”下拉列表中从以下选项中进行选择:

    • None

      在索引过程中不应用词干或替代词表单。

    • 默认替代字Forms

      在索引过程中会自动完成词干。

    • 域词典

      您设置为词干词典的任何域词典都将用作替代词形的源。

      请参阅关于字典

      请参阅将词典配置为词干词典

    如果在AdobeSearch&Promote中启用了短语词干,请注意,短语中也会出现替代词形式。

    请参阅Search&Promote8.15.0发行说明(6/19/2014)

    语言

    默认值为英语(美国)

    所选语言确保根据世界所选部分使用的惯例分析日期和数值。

    替代单词Forms 设置为默认替代单词Forms 或设置为域词典时,单词形式和词尾会根据所选语言的语言规则而改变。

    默认情况下,“语言”设置不用于确定从您的网站读取的页面的语言。 读取页面的语言由其HTTP头或页面本身的元标记确定。 您的网站可能包含多种不同语言的页面。 无论此处选择的语言如何,都可以正确阅读和索引每个页面。

    如果对网站上的某些页面使用Unicode字符集编码(如UTF-8),请确保正确指定了这些页面的语言。 如果Unicode文档不存在相应的HTTP头或元标记,则可以使用设置 > 元数据 > 注入来指定相应的语言。

    选中应用于没有指定语言的文档? 对从您的网站读取的没有明确设置的页面使用语言设置。当您的文档中只有某些没有语言设置时,请使用此设置。 如果您的文档的没有具有语言设置,或者受影响的文档集是众所周知且可管理的小列表,请使用设置 > 元数据 > 注入

    请参阅关于Injections

    使用反编译器?

    注意: 此功能仅用于丹麦语和德语。 此外,默认情况下不启用此功能。 请联系技术支持以激活该功能以供您使用。 启用后,使用Decompounder? 选项仅在您从此表前面所述的“语 言”下 式列表 中选 择丹麦语或德 语时才显示在用户界面中。

    当您选择使用Decompounder时? ,该服务将丹麦语或德语复合词分解,允许在原始复合词的同时索引组件词。

    要了解此功能的工作方式,请在文本字段中输入单词,然后单击测试

  3. 单击 Save Settings.

  4. 要预览更改的结果,请单击​regenerate your staged site index​以重新构建分阶段网站索引。

  5. (可选)执行下列操作之一:

在此页面上