关于索引的远程控制

只要您的网站发生更改,您就可以运行脚本或项目,请求搜索自动机使用远程控制运行索引。

使用远程控件对进行索引

远程控制索引请求通常来自位于您服务器上的脚本或项目。

该机器人执行的索引步骤与从Index菜单手动启动的步骤相同。 要提交远程控制请求,请配置必要的密码和响应字符串。

如何发出远程控制请求

要发出远程控制请求,请根据数据中心位置使用以下格式示例:

数据中心位置

示例

伦敦

https://center.lon5.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op

北美洲

https://center.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op

新加坡

https://center.sin2.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op

字符串和值

描述

sp_a=sp99999999

您的帐号。

您可以在 Settings > Account Options > Account Settings 下找到您的帐号。

sp_lines= N

允许您检查正在运行的索引爬网的状态。

N 是正整数或全 。如果这是数值,则JSON响应中将包括相应索引日志文件的最后一行 N 行。

如果值为所有,则返回整个文件。

如果值为 0 ,则不返回日志信息。 此值是运行索引状态查询的默认值。

sp_operation= op

允许您指定要运行的以下索引操作之一:

  • full_index

    搜索机器人会运行您网站的完整索引。

  • incremental_index

    搜索机器人使用在Index > > Configuration下设置的配置运行增量索引。

  • vertical_index

    该搜索机器人使用在Index > > Configuration下设置的配置运行垂直更新。

    请参阅关于垂直更新

  • script_index

    该搜索机器人使用在Index > 脚本索引 > Configuration下指定的文本文件运行增量索引。

  • full_staged_index

    搜索自动机运行网站的完整分阶段索引。

  • incremental_staged_index

    该搜索机器人使用在Index > Incremental Index > Configuration下设置的配置来运行增量分级索引。

  • vertical_staged_index

    该搜索机器人使用在Index > Vertical Update > Configuration下设置的配置来运行垂直分级更新。

注意: 要使用垂直更新,您可能需要由Adobe帐户代表或Adobe支持在您的帐户中启用它。

请参阅关于垂直更新

您可以将_saved 附加到以上任何 sp_operation 值,以让搜索自动机尝试使用已保存的内容。 例如,您可以指定以下内容:

sp_operation=full_index_saved

sp_operation=full_staged_index_saved

或者,可以将 _status 附加到以上任何 sp_operation 值,以请求当前或最近操作的状态报告。 例如,您可以指定以下内容:

sp_operation=full_index_status

sp_operation=full_staged_index_status

结果将作为JSON对象返回。 包括 sp_lines=N 以包括关联日志文件的N行。 如果N为负,则包括最后N行。

sp_operation= pushlive

允许您远程推送分阶段索引。

忽略将_saved 追加到推送实时操作的任何尝试。

运行 pushlive 操作时,OK、Priority或Error响应文本字符串将返回到服务器。 在远程控制页面上指定这些响应字符串。

请参阅配置远程控制以建立索引

如果在没有分阶索引时实时推送,则不会发生任何情况,并返回“确定”响应字符串。

sp_password= xxxxxx

遥控密码。

搜索以适当的HTTP响应形式返回数据。 完整响应由HTTP状态、HTTP响应头、空行和响应字符串组成。

例如,假定您执行以下远程控制请求:

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index

以下是服务器的响应:

Status: 200 OK 
Content-type: text/plain 
OK

或者,假设您执行以下远程控制状态请求:

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status

来自服务器的响应可能如下所示:

Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T10:58:58-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "status": 1, 
    "message": "ok" 
}

要获取与此索引操作关联的日志列表的前十行及其状态,使用以下查询:

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=10

来自服务器的响应:

Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T10:59:30-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "offset": 672, 
    "lines": [ 
        "07/25 16:40:07 PST   ======== Starting manual crawl of account sp99999999. ========", 
        "07/25 16:40:08 PST   Loading existing data", 
        "07/25 16:40:08 PST   Downloading entrypoint https://www.atomz.com/", 
        "07/25 16:40:08 PST   Robots.txt exclude mask: https://www.atomz.com/snap", 
        "07/25 16:40:08 PST   Exclude mask: regexp ^https://www.atomz.com/$", 
        "07/25 16:40:08 PST   Include mask: https://www.atomz.com/", 
        "07/25 16:40:08 PST   Downloading https://www.atomz.com/style.css", 
        "07/25 16:40:09 PST   Ignoring https://www.atomz.com/style.css, document type 'text/css'.", 
        "07/25 16:40:09 PST   Downloading https://www.atomz.com/privacy.html", 
        "07/25 16:40:09 PST   Downloading https://www.atomz.com/terms.html" 
    ], 
    "status": 1, 
    "message": "ok" 
}

记下offset值。 此值标识日志文件中读取中断时的文件偏移位置。 要读取文件中的​下一行​十行,您应在发送到服务器的请求中包括&sp_offset=672

使用sp_offset,您可以有效地翻阅日志文件。

要获取日志的​最后​十行以及状态,请将计数指定为负数。 例如,指定sp_lines=,其值为-10,如下所示:

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=-10

来自服务器的响应:

Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T11:01:14-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "lines": [ 
        "07/25 16:40:20 PST   End Time: 07/25/2017 16:40:20 PST", 
        "07/25 16:40:20 PST   Elapsed Time: 13 seconds", 
        "07/25 16:40:20 PST   Pages Crawled: 3 pages", 
        "07/25 16:40:20 PST   Pages Indexed: 3 pages", 
        "07/25 16:40:20 PST   Words/Bytes Indexed: 2373 words/ 20618 bytes", 
        "07/25 16:40:20 PST   Errors: 0", 
        "07/25 16:40:20 PST   *** Index Summary ***", 
        "07/25 16:40:20 PST   Total Pages: 3", 
        "07/25 16:40:20 PST   --------------------------------------------------------------------", 
        "07/25 16:40:20 PST   ======== Finish manual crawl of account sp99999999: Done. ========" 
    ], 
    "status": 1, 
    "message": "ok" 
}

请注意,此处没有返回任何offset值,因为此操作在文件末尾完成,并且没有其他行可供读取。

为索引配置远程控制

只要您的网站发生更改,您就可以使用远程控制从您的服务器运行脚本或项目,请求搜索自动机运行索引。

为索引配置远程控制

  1. 在产品菜单上,单击​Index > Remote Control

  2. 在Remote Control页面上,设置每个配置字段选项,以便能够自动提交来自服务器的索引请求以索引您的网站。

    选项

    描述

    远程控制密码

    指定远程控制密码。

    密码区分大小写,长度至少为六个字符,并且必须至少包含一个字母。 建议您还至少包含一个数字。

    请勿使用网站搜索/促销登录密码。

    您的密码将用于每个远程控制请求。

    确定响应字符串

    允许您指定OK响应文本字符串(如果请求的索引操作成功开始)。 在这种情况下,搜索自动机会将您的OK响应字符串返回到服务器。

    优先级响应字符串

    如果在发出远程请求时正在执行另一个索引操作,则搜索机器人无法执行所请求的索引。 在这种情况下,您的优先级响应文本字符串将返回到服务器。

    错误响应字符串

    允许您指定错误响应文本字符串。如果密码不正确,或发生其他错误。 在这种情况下,搜索自动机会将您的“错误”响应字符串返回给服务器。

  3. 单击 Save Changes.

在此页面上

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now