关于单词和语言

您可以使用Words & Language确定如何将搜索词与网页内容进行匹配。

使用单词和语言

在Words & Language设置的效果对站点访客可用(包括您对这些设置所做的任何更改)之前,必须重新生成站点索引。 与索引不同,重新生成不涉及搜索网页,只需几秒钟。

配置搜索词与Web内容的匹配方式

您可以使用“单词和语言”来确定网站搜索/销售如何将搜索词与网页内容相匹配。

配置搜索词与Web内容的匹配方式

  1. 在产品菜单中,单击​Linguistics > Words & Language

  2. 在Words & Languages页面上,设置所需的选项。

    选项

    描述

    区分大小写

    默认情况下未选中。

    确定大写字母是否与小写字母区分开。 例如,选择“成功”时,会将“成功”与“成功”区分开来,并且搜索结果可能因二者而异。

    发音符号敏感性

    默认为已选中。

    确定包含变音符字符的单词是否与不包含变音符的单词区分开来。 例如,选择“pagina”时,会将“pagina”与“página”区分开来。 如果您的网站使用非英语语言,请取消选择此选项。

    数字

    默认为已选中。

    确定是否对包含数字的单词进行索引。

    忽略撇号

    默认情况下未选中。

    撇号将从查询中删除。 例如,搜索“树”将返回与搜索“树”相同的结果。

    忽略连字符

    默认情况下未选中。

    从查询中删除连字符。 例如,搜索“blue-bell”将返回与搜索“bluebell”相同的结果。

    部分字母数字匹配

    默认情况下未选中。

    选择此选项后,您可以在字母数字过渡上拆分令牌,以允许部分或产品令牌上的自由文本匹配。

    例如,假定网站上一个或多个页面的正文内容中有一个产品标识符 910XT 。 当此选项被选中时,在搜索 910XT 时,AdobeSearch&Promote会查找此产品标识符的匹配项。 在启用搜索连接-Div后,AdobeSearch&Promote也会找到 910 XT 。 但是,它不会只找到 910 XT 的实例。

    当您选择部分字母数字匹配时,索引器会将这些混合字母数字令牌分为多个令牌。 例如,将产品标识符(如XYZ123 )索引到三个令牌中: XYZ123 XYZ 123 。 此类功能允许在任何这些变体上进行搜索时自由文本匹配。

    在另一个示例中,假定您的产品标识符为 AB910XT 。 如果选择部分字母数字匹配 已打开搜索连接-Div-启用,AdobeSearch&Promote将其索引为 AB910XT 和<a110/> AB 、 910 XT 例如,当用户搜索 910XT 时,搜索会扩展以同时查找 910XT 910 XT 的实例。

    注意: 默认情况下,未启用搜索连接-Div-启用。 请与技术支持联系以激活该功能供您使用。

    注意: 部分字母数字匹配将全局应用于所有索引字段。 但是,它只影响自由文本匹配;它不影响精确匹配或范围匹配。

    相似音匹配

    默认为已选中。

    音效相同的词,如“健康”和“健康”。 尽管拼写错误,客户仍可通过此功能轻松进行搜索。

    替代词Forms

    默认值为默认替代字Forms

    您可以在“备用单词Forms”下拉列表中选择以下选项:

    • None

      索引过程中不应用词干或替代词表单。

    • 默认替代字Forms

      在编制索引时会自动完成词干。

    • 域词典

      您设置为词干词典的任何域词典都将用作替代词表的源。

      请参阅关于字典

      请参阅将字典配置为词干字典

    如果AdobeSearch&Promote中启用了短语词干,请注意,替代词表单也会出现在短语中。

    请参阅Search&Promote8.15.0发行说明(2014年6月19日)

    语言

    默认值为英语(美国)

    所选语言确保根据所选部分使用的惯例分析日期和数值。

    替代单词Forms设置为默认替代单词Forms域词典时,单词形式和单词结尾会根据所选语言的语言规则发生变化。

    默认情况下,“语言”设置不用于确定从您的网站读取的页面的语言。 读取页面的语言由其HTTP头或页面本身的元标记确定。 您的网站可能包含许多不同语言的页面。 无论此处选择的语言如何,都可以正确阅读和索引每个页面。

    如果对网站上的某些页面使用UTF-8等Unicode字符集编码,请确保正确指定了每个页面的语言。 如果Unicode文档不存在相应的HTTP头或元标记,则可以使用设置 > 元数据 > 注入指定相应的语言。

    选中是否应用于没有指定语言的文档? 对从您的网站读取的没有明确设置的页面使用“语言”设置。当您的文档的某些没有语言设置时,请使用此设置。 如果您的文档的具有语言设置,或者受影响的文档集是众所周知的、可管理的小列表,请使用设置 > 元数据 > 注入

    请参阅关于Injections

    使用反编译器?

    注意: 此功能仅用于丹麦语和德语。 此外,默认情况下不启用此功能。 请与技术支持联系以激活该功能供您使用。 启用后,使用反编译器? 选项仅在您从下表前面所述的“语 言”下 式列表 中选择丹麦语或德语时 才显示在用户界面中。

    当您选择使用反编译器时? ,该服务将丹麦语或德语复合词分解,这允许将组件词与原始复合词一起索引。

    要了解此功能的工作方式,请在文本字段中输入单词,然后单击“测试”。

  3. 单击 Save Settings.

  4. 要预览更改结果,请单击​regenerate your staged site index​以重新构建分阶段网站索引。

  5. (可选)执行下列操作之一:

在此页面上