搜索匹配和排名
Adobe Commerce Optimizer将结果排名,以便购物者能够首先看到最相关的产品。 此服务对目录文本 与购物者类型紧密匹配 的产品提升最强,然后支持查询词以有意义的方式一起出现的匹配,最后包括更广泛的匹配(包括支持自动完成样式匹配的行为)。
如何区分匹配的优先级
在高级别上,相关性使用三个匹配强度层(除了下面描述的其他评分因素外):
-
精确和接近短语匹配 — 完整搜索短语与目录文本匹配,或在规范化后接近匹配,如词干匹配(例如,单形和复形解析为同一个根)。 这些匹配项获得最高的相关性提升。
-
同一字段中的所有字 — 查询中的每个字都出现在一个可搜索属性中(例如,产品 名称 中的
red和pants)。 该层得到次高的提升。 -
跨不同字段的字 — 查询词以不同的可搜索属性出现(例如,颜色中的
red和 名称 中的pants)。 这是最广泛的匹配层,获得的相关性提升最低。 它还可以匹配自动完成使用的部分查询 — 例如,当购物者在完成pants之前键入red pan时。 有关德语目录,请参阅解组合(德语)。
示例
对于诸如red pants的查询:
- 带有精确短语红色裤子 (或相近变体)的产品排在 前 位。
- red和 pants 出现在相同字段(例如,name)中的产品排名第二。
- 术语出现在不同字段(例如,颜色和名称)中的产品如下。
分解(德语) decompounding-german
德语目录使用许多复合词。 例如,spulbecken和 spul becken 可以分解为令牌,如 spul 和beck(在词干之后),因此搜索 spul becken 的购物者仍然可以找到Spulbecken。 在此层中,复合词中的分解子词必须出现在同一字段中。 其他查询词在不同的字段中可以匹配。
此 AND 要求筛选器与只有一个子词的匹配无关。 例如,当仅部分复合匹配时,对 Brauseschlauch 的搜索不再返回Schlauchstuck。 对 spulbecken 的搜索仍然可以与 spulbeckventil 匹配,因为较长的单词包含所有预期的令牌。
示例
对于诸如Brauseschlauch chrom之类的搜索短语:
- 精确和接近短语匹配 — 查找键入的完整短语brauseschlauch chrom,不进行分解(词干仍然适用)。
- 同一字段中的所有字 — 在 same 可搜索属性中查找 brauseschlauch 和chrom,仍然不进行分解(例如,在 name 中同时查找)。
- 跨不同字段的字 — 将 Brauseschlauch 分解为 brause 和schlauch。 这些令牌必须显示在 same 字段中(不一定是相邻短语)。 chrom可以在 不同的 字段中匹配(例如,name中的 brause 和schlauch,color中的chrom)。
在设置中的语言选项卡上将 语言 设置为德语,以便应用分解规则。 在生产环境中启用更改之前,请验证暂存店面上的高价值德语查询。
分解是基于规则的,可以在此层添加边框。 如果字典中缺少子词,则标记化可能不完整,并且返回的匹配范围比您预期的要广,例如,gaszahler中缺少 gas 可能只发出zahl,或 thermostat 中缺少stat。 词干程序还可以生成意外的根(例如,schrauber词干到schraub,或 schelle 到schell)。 对于已识别问题的已知案例,Adobe会更新词典和词干覆盖。
还有哪些因素会影响排名
相关性不能仅通过短语匹配来确定。 多个信号相互作用:
- 从 精确/近 个短语匹配中提升
- 当 所有查询词 出现在 相同 字段中时提升
- 智能排名(启用时),它将文本相关性与行为信号相结合 — 请参阅智能排名评分的工作原理
- 搜索每个属性的权重以及其他文本关联性因素(例如,术语出现的频率以及名称或描述长度)。 在 设置 中,配置哪些属性参与关键词搜索及其相对关键词搜索权重。
- 促销规则,例如pin、boost和bury
由于这些信号相互作用,仅在最宽级别匹配的产品有时可以排在更紧的短语匹配之上 — 例如,当 搜索权重 或高权重字段中的词频超过其他位置的较弱短语匹配时。
示例:如果 红色裤子 在 描述 中显示为短语,其中搜索权重= 1,但 红色裤子 和 裤子 分别出现在 名称 和 颜色 中,其中搜索权重= 10,则 描述 中的短语匹配项可能不会超过拆分匹配项,具体取决于整体得分。
手动 pin 和 bury 规则仍然强健;boost规则可能需要调整以克服新短语和相同字段的提升。 更改权重或规则后验证重要查询。
搜索权重1和组合索引
为特殊匹配模式(例如,包含或开头为)配置了最小搜索权重 (权重1)和 非 的属性,这些属性可在搜索索引中组合为一个内部字段(defaultSearchField),以减少字段映射开销。 将该字段视为 相同字段 匹配的一个可搜索表面:仅登陆到合并的低权重字段中的令牌将一起计算,而不是作为单独的每个属性字段计算。 Adobe可能会随着时间的推移随着匹配的发展而改进此优化。