Acerca del control remoto para indización

Siempre que cambie el sitio web, puede ejecutar una secuencia de comandos o un programa que solicite que el robot de búsqueda ejecute un índice mediante el control remoto.

Uso del control remoto para indizar

La solicitud de indización de control remoto suele proceder de una secuencia de comandos o de un programa que se encuentra en el servidor.

El robot realiza los mismos pasos de indexación que si se hubiera iniciado manualmente desde el menú Index. Para enviar una solicitud de control remoto, configure la contraseña y las cadenas de respuesta necesarias.

Cómo realizar una solicitud de control remoto

Para realizar una solicitud de control remoto, utilice los siguientes ejemplos de formato basados en la ubicación del centro de datos:

Ubicación del centro de datos

Ejemplo

Londres

https://center.lon5.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op

América del Norte

https://center.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op

Singapur

https://center.sin2.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op

o

Cadena y valor

Descripción

sp_a= sp999999999

Su número de cuenta.

Puede encontrar su número de cuenta en Configuración > Opciones de cuenta > Configuración de cuenta .

sp_lines= N

Permite comprobar el estado de un rastreo de índice en ejecución.

N es un entero positivo o todo . Si se trata de un valor numérico, las últimas líneas N del archivo de registro de índice correspondiente se incluyen en la respuesta JSON.

Si el valor es all , se devuelve el archivo completo.

Si el valor es 0 , no se devuelve ninguna información de registro. Este valor es el predeterminado para una consulta de estado de índice en ejecución.

sp_operation= op

Permite especificar una de las siguientes operaciones de indexación que desea ejecutar:

  • full_index

    El robot de búsqueda ejecuta un índice completo de su sitio web.

  • incremental_index

    El robot de búsqueda ejecuta un índice incremental utilizando la configuración establecida en Index > Incremental Index > Configuration.

  • vertical_index

    El robot de búsqueda ejecuta una actualización vertical utilizando la configuración establecida en Index > Vertical Update > Configuration.

    Consulte Acerca de la actualización vertical.

  • script_index

    El robot de búsqueda ejecuta un índice incremental utilizando el archivo de texto especificado en Index > Scripted Index > Configuration.

  • full_staged_index

    El robot de búsqueda ejecuta un índice de etapas completo del sitio web.

  • incremental_staged_index

    El robot de búsqueda ejecuta un índice escalonado incremental utilizando la configuración establecida en Index > Incremental Index > Configuration.

  • vertical_staged_index

    El robot de búsqueda ejecuta una actualización vertical escalonada utilizando la configuración establecida en Index > Vertical Update > Configuration.

Nota: Para utilizar Actualizaciones verticales, es posible que deba habilitarlo en su cuenta por parte del representante de la cuenta de Adobe o de la asistencia de Adobes.

Consulte Acerca de la actualización vertical .

Puede anexar _saved a cualquiera de los valores sp_operation anteriores para que el robot de búsqueda intente utilizar contenido guardado. Por ejemplo, puede especificar lo siguiente:

sp_operation=full_index_saved

o

sp_operation=full_staged_index_saved

O bien, puede anexar _status a cualquiera de los valores sp_operation anteriores para solicitar un informe de estado para la operación actual o más reciente. Por ejemplo, puede especificar lo siguiente:

sp_operation=full_index_status

o

sp_operation=full_staged_index_status

y los resultados se devuelven como un objeto JSON. Incluya sp_lines=N para incluir N líneas del archivo de registro asociado. Si N es negativo, se incluyen las últimas líneas N.

sp_operation= pushlive

Permite insertar de forma remota un índice escalonado.

Se ignora cualquier intento de anexar _saved a la operación push live.

Cuando se ejecuta una operación pushlive , se devuelve al servidor una cadena de texto de respuesta OK, Priority o Error. Especifique estas cadenas de respuesta en la página Control remoto .

Consulte Configuración del control remoto para indexar.

Si inserta live cuando no hay un índice de ensayo, no sucede nada y se devuelve la cadena de respuesta OK.

sp_password= xxxxxx

La contraseña del control remoto.

La búsqueda devuelve datos en forma de una respuesta HTTP adecuada. La respuesta completa se compone de un estado HTTP, encabezados de respuesta HTTP, una línea en blanco y la cadena de respuesta.

Por ejemplo, supongamos que realiza la siguiente solicitud de control remoto:

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index

A continuación se muestra la respuesta del servidor:

Status: 200 OK 
Content-type: text/plain 
OK

O bien, supongamos que realiza la siguiente solicitud de estado de control remoto:

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status

La respuesta del servidor puede tener el siguiente aspecto:

Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T10:58:58-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "status": 1, 
    "message": "ok" 
}

Para obtener las diez primeras líneas del listado de registros asociado a esta operación de índice, junto con su estado, se utiliza la siguiente consulta:

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=10

La respuesta del servidor:

Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T10:59:30-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "offset": 672, 
    "lines": [ 
        "07/25 16:40:07 PST   ======== Starting manual crawl of account sp99999999. ========", 
        "07/25 16:40:08 PST   Loading existing data", 
        "07/25 16:40:08 PST   Downloading entrypoint https://www.atomz.com/", 
        "07/25 16:40:08 PST   Robots.txt exclude mask: https://www.atomz.com/snap", 
        "07/25 16:40:08 PST   Exclude mask: regexp ^https://www.atomz.com/$", 
        "07/25 16:40:08 PST   Include mask: https://www.atomz.com/", 
        "07/25 16:40:08 PST   Downloading https://www.atomz.com/style.css", 
        "07/25 16:40:09 PST   Ignoring https://www.atomz.com/style.css, document type 'text/css'.", 
        "07/25 16:40:09 PST   Downloading https://www.atomz.com/privacy.html", 
        "07/25 16:40:09 PST   Downloading https://www.atomz.com/terms.html" 
    ], 
    "status": 1, 
    "message": "ok" 
}

Observe el valor offset. Este valor identifica la posición de desplazamiento del archivo en el archivo de registro en el que se ha dejado de leer. Para leer las siguientes diez líneas del archivo, debe incluir, en este ejemplo, &sp_offset=672 en la solicitud enviada al servidor.

Al utilizar sp_offset, puede desplazarse de forma eficaz por un archivo de registro.

Para obtener las últimas diez líneas del registro, junto con el estado, especifique el recuento como un número negativo. Por ejemplo, especifique sp_lines= con un valor de -10 como se muestra a continuación:

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=-10

La respuesta del servidor:

Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T11:01:14-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "lines": [ 
        "07/25 16:40:20 PST   End Time: 07/25/2017 16:40:20 PST", 
        "07/25 16:40:20 PST   Elapsed Time: 13 seconds", 
        "07/25 16:40:20 PST   Pages Crawled: 3 pages", 
        "07/25 16:40:20 PST   Pages Indexed: 3 pages", 
        "07/25 16:40:20 PST   Words/Bytes Indexed: 2373 words/ 20618 bytes", 
        "07/25 16:40:20 PST   Errors: 0", 
        "07/25 16:40:20 PST   *** Index Summary ***", 
        "07/25 16:40:20 PST   Total Pages: 3", 
        "07/25 16:40:20 PST   --------------------------------------------------------------------", 
        "07/25 16:40:20 PST   ======== Finish manual crawl of account sp99999999: Done. ========" 
    ], 
    "status": 1, 
    "message": "ok" 
}

Tenga en cuenta que no se devuelve ningún valor offset aquí, ya que esta operación finalizó al final del archivo y no hay más líneas que leer.

Configuración del control remoto para indexar

Siempre que el sitio web cambie, puede utilizar el control remoto para ejecutar una secuencia de comandos o un programa desde el servidor, solicitando que el robot de búsqueda ejecute un índice.

Para configurar el control remoto para indexar

  1. En el menú del producto, haga clic en Index > Remote Control.

  2. En la página Remote Control, establezca cada opción de campo de configuración para poder enviar una solicitud de indexación desde el servidor automáticamente para indexar el sitio Web.

    Opción

    Descripción

    Contraseña de control remoto

    Especifique la contraseña del control remoto.

    Las contraseñas distinguen entre mayúsculas y minúsculas, tienen al menos seis caracteres y deben incluir al menos una letra. Se recomienda incluir al menos un número.

    No utilice la contraseña de inicio de sesión de búsqueda/comercialización del sitio.

    Su contraseña se utiliza en cada solicitud de control remoto.

    Cadena de respuesta correcta

    Permite especificar una cadena de texto de respuesta OK si la operación de índice solicitada comienza correctamente. En estos casos, el robot de búsqueda devuelve la cadena de respuesta OK al servidor.

    Cadena de respuesta de prioridad

    Si hay otra operación de indexación en curso cuando se realiza la solicitud remota, el robot de búsqueda no puede realizar el índice solicitado. En estos casos, la cadena de texto de respuesta de prioridad se devuelve al servidor.

    Cadena de respuesta de error

    Permite especificar una cadena de texto de respuesta a un error Si la contraseña es incorrecta o si se produce otro error. En estos casos, el robot de búsqueda devuelve la cadena de respuesta Error al servidor.

  3. Haga clic Save Changes.

En esta página