索引参考

<script src=“https://gist.github.com/dominique-pfister/92cb67b6f95e1edee6a7d6508b124039.js”></script>

includeexclude 部分规定了要索引的文档。 包括但未排除的所有内容都将编制索引。 双星号 ** 匹配前缀下的所有内容, 包括 前缀,因此在上面的示例中,路径 /documents 也会被编入索引。 如果你把那部分全部省略, 全部 已编入索引。

select 属性是一个CSS选择器,用于从文档中抓取HTML元素。 索引器会将您的选择器应用于HTML标记,而不是应用于渲染的dom,因此您必须相应地编写它们。 (在要从中提取信息的页面上,右键单击 — >查看页面源,可查看索引器将处理的确切HTML)。

要验证输入的CSS选择器是否选择了您所需的内容,您可以使用 aem cli - aem up -–print-index,导航到选择器应提取有意义值的页面,然后查看控制台。 cli将使用 helix-query.yaml 文件,并将打印提取的值;如果找不到要查找的信息,则打印空字符串。

aem up --print-index
...
info: Index information for /my/test/page
info: Index: mysite
info:            author: "John Smith"

请注意,并非所有CSS选择器都受支持。 在内部,我们使用一个名为 hast-util-select,并且支持的选择器列表可在此处找到: https://github.com/syntax-tree/hast-util-select#support

valuevalues 属性包含要应用于所有选定的HTML元素的表达式。 属性名称 value 首选参数是您需要字符串, values 另一方面,会为您提供一个包含找到的所有匹配项的数组。 表达式可以包含函数和变量的组合:

innerHTML(el)

返回元素的HTML内容。

textContent(el)

返回所选元素的文本内容及其所有后代。

attribute(el, name)

返回具有指定元素名称的属性的值。

匹配(el, re)

匹配包含括号的正则表达式,以捕获传递的元素中的项目。 在上面的作者示例中, <p> 所选元素可能包含 by John Smith,因此它将捕获以下所有内容 by .

单词数(el、start、end)

这对Teaser很有用,它可以从HTML元素中选择一系列单词。

replace(el, substr, newSubstr)

使用替换内容替换文本中第一次出现的子字符串。

replaceAll(el, substr, newSubstr)

将文本中所有出现的子字符串替换为替换内容。

parseTimestamp(el,格式)

解析作为字符串提供的时间戳 自定义格式,并返回其值,以自1970年1月1日以来的秒数表示。

dateValue(el,格式)

解析以字符串形式指定的时间戳,并将其值作为序列号返回,其中1900年1月1日是序列号1。 有关详细信息,请参阅 DATEVALUE函数

el

返回由选择的HTML元素 select 属性。

路径

返回正在编制索引的HTML文档的路径。

标头[名称]

在获取HTML文档时,返回具有指定名称的HTTP响应标头的值。

1 的完整定义 helix-query.yaml 可从此处获取: https://github.com/adobe/helix-shared/blob/main/docs/indexconfig.md

recommendation-more-help
10a6ce9d-c5c5-48d9-8ce1-9797d2f0f3ec