关于单词和语言

您可以使 Words & Language 用来确定如何将搜索词与网页内容相匹配。

使用单词和语言

在设置的效果 Words & Language 对站点访客可用(包括您对这些设置所做的任何更改)之前,您必须重新生成站点索引。 与索引不同,重新生成不涉及搜索网页,只需几秒钟。

配置搜索词与Web内容的匹配方式

您可以使用“单词和语言”来确定网站搜索/销售如何将搜索词与网页内容相匹配。

配置搜索词与Web内容的匹配方式

  1. 在产品菜单中,单击 Linguistics > Words & Language

  2. 在页 Words & Languages 面上,设置所需的选项。

    选项

    描述

    区分大小写

    默认情况下未选中。

    确定是否区分大写字母和小写字母。 例如,选择“成功”时,会将“成功”与“成功”区分开来,并且搜索结果可能因两者而异。

    音调符号敏感度

    默认选中。

    确定包含变音符的单词是否与不包含变音符的单词区分开来。 例如,当选择“pagina”时,会将“página”与“página”区分开来。 如果您的网站使用非英语语言,请取消选择此选项。

    数字

    默认选中。

    确定是否对包含数字的单词进行索引。

    忽略撇号

    默认情况下未选中。

    从查询中删除撇号。 例如,搜索“Tree's”将返回与搜索“Trees”相同的结果。

    忽略连字符

    默认情况下未选中。

    从查询中删除连字符。 例如,搜索“blue-bell”将返回与搜索“bluebell”相同的结果。

    部分字母数字匹配

    默认情况下未选中。

    选择此选项后,您可以在字母数字转换上拆分令牌,以允许部分或产品令牌上的自由文本匹配。

    例如,假定您在网站上一个或多个页面的正文 容中具有910XT的产品标识符。 如果未选择此 选项 , Adobe Search&Promote在搜索 910XT时会查找此产品标识符的 匹配项 。 而且,在 打开“启用搜索” 后, Adobe Search&Promote还 会找到 910 XT 。 但是,它不会只找到910或 XT的 实例。

    当您选择“部分字 母数字匹配” 时,索引器会将这些混合字母数字令牌分为多个令牌。 例如,将产品标识符(如 XYZ123)索引 到三个令牌中: XYZ 123 XYZ 123 。 这种功能允许在任何这些变体上进行搜索时间自由文本匹配。

    在另一个示例中,假定您的产品标识符 为AB910XT 。 如果选择“部分字 母数字匹配”,并打开 “搜索关联- Concat-Adobe”索引,将其作为AB91XT,AB引导,AB引导,90个引导,并且已经打开Div,Div的搜索引起Adobe索引。 然后,当用户搜索 910XT时 ,搜索会展开以同时查找 910XT、910或 XT的实例。

    注意: 默 认情况下,“搜索连接 -Div-启用”未启用。 请联系技术支持以激活该功能供您使用。

    注意: “部 分字母数字匹 配”将全局应用于所有索引字段。 但是,它只影响自由文本匹配;它不会影响精确匹配或范围匹配。

    相似声音匹配

    默认选中。

    类似声音的词语,如“健康”和“健康”。 尽管单词拼写错误,但此功能使客户能轻松搜索。

    替代Word表单

    默认为“ 默认替代字表单”

    您可以从“备用单词表单”下拉列表中选择以下选项:

    • None

      在索引过程中不应用词干或替代单词表单。

    • 默认替代字表单

      在索引过程中会自动完成词干提取。

    • 域词典

      您设置为词干词典的任何域词典都将用作替代单词表单的源。

      请参 阅关于字典

      请参 阅将词典配置为词干词典

    如果在 Adobe Search&Promote中启用了短语词干,请注意 替代单词表单也会出现在短语中。

    请参 阅Search&Promote 8.15.0发行说明(2014/6/19)

    语言

    默认为 英语(美国)

    所选语言确保根据世界所选部分使用的惯例分析日期和数值。

    当“替 代单词表单”设 置为“默认替代单词表单”或“域词典”时,单词表单和单词结尾会根据所选语言的语言规则而发生变化。

    默认情况下,“语言”设置不用于确定从您的网站读取的页面的语言。 读取页面的语言由其HTTP头或页面本身中的元标记确定。 您的网站可能包含多种不同语言的页面。 无论此处选择的语言如何,都可以正确阅读和索引每个页面。

    如果对网站上的某些页面使用Unicode字符集编码(如UTF-8),请确保正确指定每个页面的语言。 如果Unicode文档不存在相应的HTTP头或元标记,则可以使用 “设置” > “元数据” > “注入” 指定相应的语言。

    选中“ 应用于没有指定语言的文档”? 对从您的网站读取的没有明确设置的页面使用“语言”设置。 仅在某些文档 没有语言 设置时,使用此设置。 如果您的 文档没有语言设 置,或者您的文档包含一组众所周知、规模 可管理的小列表,请使用“设置” > “元数据” > “注入”。

    请参 阅注射

    使用反编译程序?

    注意: 此功能仅用于丹麦语和德语。 此外,默认情况下不启用此功能。 请联系技术支持以激活该功能供您使用。 启用后,使用反编 译程序? 选项仅在您从此表前面所述的“语言”下拉 列表中选 择“丹麦语”或“ 德语” 时,才 会显示在用户界面中。

    当您选择“使 用反编译器”时? ,该服务将分解丹麦语或德语复合词,这允许将组件词与原始复合词一起索引。

    要了解此功能的工作方式,请在文本字段中输入单词,然后单击“测 试”

  3. 单击 Save Settings.

  4. 要预览更改的结果,请单击以重 regenerate your staged site index 新构建分阶段的网站索引。

  5. (可选)执行下列操作之一:

在此页面上