索引参考
<script src=“https://gist.github.com/dominique-pfister/92cb67b6f95e1edee6a7d6508b124039.js”></script>
此 include
和 exclude
部分规定了要索引的文档。 包括但未排除的所有内容都将编制索引。 双星号 **
匹配前缀下的所有内容, 包括 前缀,因此在上面的示例中,路径 /documents
也会被编入索引。 如果你把那部分全部省略, 全部 已编入索引。
此 select
属性是一个CSS选择器,用于从文档中抓取HTML元素。 索引器会将您的选择器应用于HTML标记,而不是应用于渲染的dom,因此您必须相应地编写它们。 (在要从中提取信息的页面上,右键单击 — >查看页面源,可查看索引器将处理的确切HTML)。
要验证输入的CSS选择器是否选择了您所需的内容,您可以使用 aem cli - aem up -–print-index
,导航到选择器应提取有意义值的页面,然后查看控制台。 cli将使用 helix-query.yaml
文件,并将打印提取的值;如果找不到要查找的信息,则打印空字符串。
aem up --print-index
...
info: Index information for /my/test/page
info: Index: mysite
info: author: "John Smith"
请注意,并非所有CSS选择器都受支持。 在内部,我们使用一个名为 hast-util-select
,并且支持的选择器列表可在此处找到: https://github.com/syntax-tree/hast-util-select#support
此 value
或 values
属性包含要应用于所有选定的HTML元素的表达式。 属性名称 value
首选参数是您需要字符串, values
另一方面,会为您提供一个包含找到的所有匹配项的数组。 表达式可以包含函数和变量的组合:
innerHTML(el)
返回元素的HTML内容。
textContent(el)
返回所选元素的文本内容及其所有后代。
attribute(el, name)
返回具有指定元素名称的属性的值。
匹配(el, re)
匹配包含括号的正则表达式,以捕获传递的元素中的项目。 在上面的作者示例中, <p>
所选元素可能包含 by John Smith
,因此它将捕获以下所有内容 by
.
单词数(el、start、end)
这对Teaser很有用,它可以从HTML元素中选择一系列单词。
replace(el, substr, newSubstr)
使用替换内容替换文本中第一次出现的子字符串。
replaceAll(el, substr, newSubstr)
将文本中所有出现的子字符串替换为替换内容。
parseTimestamp(el,格式)
解析作为字符串提供的时间戳 自定义格式,并返回其值,以自1970年1月1日以来的秒数表示。
dateValue(el,格式)
解析以字符串形式指定的时间戳,并将其值作为序列号返回,其中1900年1月1日是序列号1。 有关详细信息,请参阅 DATEVALUE函数
el
返回由选择的HTML元素 select
属性。
路径
返回正在编制索引的HTML文档的路径。
标头[名称]
在获取HTML文档时,返回具有指定名称的HTTP响应标头的值。
1 的完整定义 helix-query.yaml
可从此处获取: https://github.com/adobe/helix-shared/blob/main/docs/indexconfig.md