关于增量索引

您可以使用增量索引为实时网站或分阶段网站的“片段”(如频繁更改的页面集合)编制索引。

使用增量索引

增量索引只需几秒钟即可执行,对于需要数小时才能完成索引的大型网站非常有用。

生成增量索引时,将显示状态信息,如开始时间、已用时间和索引过程中的错误。 还会显示有关上一个索引状态的信息。

您可以随时停止或重新启动增量索引创建过程。

当新增索引为实时网站构建时,客户可以继续使用您的上次增量索引搜索您的站点。

配置分阶段网站的增量索引

您可以通过指定网站URL和URL蒙版来配置要包含在增量索引中的网站页面。

配置分阶段网站的增量索引

  1. 在产品菜单上,单击 Index > Incremental Index > Configuration

  2. 在页 Incremental Index Configuration 面上,使用各个字段指定要索引的页面。

    字段

    描述

    添加或更新URL

    指定URL。

    搜索自动机仅对自您上次编制索引以来已更改的指定文档进行索引。

    此外,搜索自动机会遵循包含在指定文档中的链接,并仅对已更改的文档进行索引。

    此字段必须仅包含文档URL,而不能包含蒙版,如下例所示:

    https://www.mydomain.com/products/new.html

    您可以在URL中使用以下关键字:

    • noindex

      如果不想为页面上与指定URL匹配的文本编制索引,但想要遵循页面的链接,请在URL之后添加,如 noindex 下例所示:

      https://www.mydomain.com/products/new.html noindex

      请务必从URL noindex 中分离一个空格;逗号不是有效的分隔符。

    • nofollow

      如果要为页面上与指定URL匹配的文本编制索引,但不想跟随页面的链接,请在URL后添加 nofollow ,如以下示例所示:

      https://www.mydomain.com/products/new.html nofollow

      请务必从URL nofollow 中分离一个空格;逗号不是有效的分隔符。

    查找和更新URL蒙版

    指定简单的URL蒙版——完整路径、部分路径或使用通配符或常规表达式的路径。

    搜索自动机只查找自您上次编制索引以来已更改的所有匹配文档和索引。

    此外,搜索自动机会遵循包含在匹配文档中的链接,并仅对那些已更改的页面进行索引。 例如:

    https://www.mydomain.com/products/household/*.html

    您还可以使用常规表达式,如以下示例所示:

    regexp ^https://www\.mydomain\.com/products/household/.*\.html$

    请参阅 常规表达式

    您还可以使用关键字 nofollow , noindex 如上面添加 或更新URL中 所述。

    包括和排除URL蒙版

    指定简单的包括或排除URL蒙版——完整路径、部分路径或使用通配符或常规表达式的路径。

    搜索自动机根据指定的掩码类型查找和索引(“include”)或忽略(“exclude”)文档。

    在为站点编制索引时,将按照外观的顺序遵循方向。 例如,以下蒙版列表:

    include https://www.mydomain.com/products/household/lightbulbs*.html

    exclude https://www.mydomain.com/products/

    索引页 lightbulbs1.html lightbulbs2.html 。 但是,它不会为products目录下列出的任何其他页面编制索引。

    首先显示的URL掩码始终优先于稍后在列表中显示的URL掩码。 此外,如果搜索自动机遇到与包括蒙版和排除蒙版均匹配的文档,则首先列出的蒙版优先。

    您还可以使用关键字 nofollow , noindex 如上面添加 或更新URL中 所述。

    请参 阅关于URL蒙版

    包括和排除日期蒙版

    指定简单的包含或排除日期蒙版——完整路径、部分路径或使用通配符或常规表达式的路径。

    搜索自动机根据URL和文档日期查找和索引(“include”)或忽略(“exclude”)文档。

    您可以使用以下类型的日期蒙版:

    • include-days NNN

      搜索自动机为与指定URL掩码匹配且版本为NNN(天数)或更高的所有文档建立索引。

      您可以使用以下一个或多个关键字跟随URL掩码:

      • nofoly
      • noindex
      • server-date

      例如,以下掩码包括/archive/support文件夹中0天或更早的所有文档:

      include-days 0 https://www.mydomain.com/archive/support/

    • include-date YYYY-MM-DD

      搜索自动机为与指定URL掩码匹配且旧或旧于YYYY-MM-DD日期的所有文档建立索引。

      您可以使用以下一个或多个关键字跟随URL掩码:

      • nofoly
      • noindex
      • server-date

      以下掩码示例包括2011年7月25日或之前/archive/文件夹中的所有文档:

      include-date 2011-07-25 https://www.mydomain.com/archive/

    • exclude-days NNN

      禁用所有与指定URL掩码匹配且版本为NNN(天数)或更高的文档的索引。

      或者,您也可以按关键字使用URL掩码 server-date

      以下蒙版示例从索引中排除所有90天或更旧的PDF文件:

      exclude-days 90 *.pdf

    • exclude-date YYYY-MM-DD

      禁用与指定URL掩码匹配且旧文档或旧数据早于YYYY-MM-DD的所有索引。

      或者,您也可以按关键字使用URL掩码 server-date

      以下掩码示例不包括2004年4月23日或之前/archive/文件夹中的所有文档:

      exclude-date 2004-04-23 https://www.mydomain.com/archive/

    请参阅 关于日期蒙版

    删除URL

    指定URL。

    搜索自动机会从搜索索引中查找并删除指定文档。 如果指定的页面已在您的搜索索引中,则自动机会在添加或更新任何其他页面之前将其删除。

    此字段只能包含文档URL,而不能包含蒙版。

    查找和删除URL蒙版

    指定简单的URL蒙版——完整路径、部分路径或使用通配符或常规表达式的蒙版。

    如果指定的URL掩码与搜索索引中的页面匹配,则搜索自动机会在添加或更新任何其他页面之前删除这些页面。 例如:

    https://www.mydomain.com/products/1998/household/*

    您还可以使用常规表达式,如以下示例所示:

    regexp ^https://www\.mydomain\.com/products/199[567]/.*$

    请参阅 常规表达式

  3. 单击 Save Changes.

  4. (可选)执行下列操作之一:

为实时网站设置增量索引计划

您可以选择增量索引频率以及用于爬网和更新增量索引的基本时间。

您选择的时间根据在“帐户设置”中配置的时区为本地时间。

请参 阅配置帐户设置

Web服务器通常安排在半夜停机进行维护。 如果服务器在计划的索引时间内关闭,则索引编制过程将失败。 请确保选择一天中有Web服务器可用的时间。

索引计划只适用于您的实时索引;无法计划暂存索引。

为实时网站设置增量索引计划

  1. 在产品菜单上,单击 Index > Incremental Index > Live Schedule
  2. 在页面 Incremental Index Schedule 的下拉列表 Incrementally Index 中,以小时或分钟为单位选择索引频率。
  3. 在下 Base Time 拉列表中,选择要重新生成新增索引的开始时间。
  4. 单击 Save Changes.

运行实时网站或分阶段网站的增量索引

您可以使用增量索引为实时网站或分阶段网站的“片段”(如频繁更改的页面集合)编制索引。

运行实时网站或分阶段网站的增量索引

  1. 在产品菜单中,执行下列操作之一:

    • 单击 Index > Incremental Index > Live Index.

    • 单击 Index > Incremental Index > Staged Index.

  2. 单击 Incremental Index Now.

  3. (可选)如果出现索引错误,请单 View Errors 击以视图关联的日志。

查看实时网站或分阶段网站的增量索引日志

当实时增量索引或分阶段增量索引完成时,您可以视图其关联日志以排除出现的任何错误。

无法导出日志,也无法保存它们。 日志在出现新索引之前一直可供查看。

视图实时网站或分阶段网站的增量索引日志

  1. 在产品菜单中,执行下列操作之一:

    • 单击 Index > Incremental Index > Live Log.

    • 单击 Index > Incremental Index > Staged Log.

  2. 在日志页面的顶部或底部,执行下列任一操作:

    • 使用导航选 First​项 PrevNextLast​或 Go to line 在日志中移动。

    • 使用显示选 Errors only​项 Wrap line​或 Show 优化您看到的内容。

在此页面上