Acerca del control remoto para la indexación

Siempre que cambie su sitio web, puede ejecutar un script o programa solicitando que el robot de búsqueda ejecute un índice usando control remoto.

Uso del control remoto para indexar

La solicitud de indexación de control remoto suele proceder de un script o un programa que se encuentra en el servidor.

El robot realiza los mismos pasos de indexación que si se hubieran iniciado manualmente desde el menú Index. Para enviar una solicitud de control remoto, se configuran las cadenas de contraseña y respuesta necesarias.

Cómo realizar una solicitud de control remoto

Para realizar una solicitud de control remoto, utilice los siguientes ejemplos de formato en función de la ubicación del centro de datos:

Ubicación del centro de datos

Ejemplo

Londres

https://center.lon5.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op

América del Norte

https://center.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op

Singapur

https://center.sin2.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op

o

Cadena y valor

Descripción

sp_a= sp99999999

Su número de cuenta.

Puede encontrar su número de cuenta en Configuración > Opciones de cuenta > Configuración de cuenta .

sp_lines= N

Permite comprobar el estado de un rastreo de índice en ejecución.

N es un número entero positivo o todo . Si se trata de un valor numérico, las últimas líneas N del archivo de registro de índice correspondiente se incluyen en la respuesta JSON.

Si el valor es todo , se devuelve el archivo completo.

Si el valor es 0 , no se devuelve información de registro. Este valor es el predeterminado para una consulta de estado de índice en ejecución.

sp_operation= op

Permite especificar una de las siguientes operaciones de indexación que desea ejecutar:

  • full_index

    El robot de búsqueda ejecuta un índice completo de su sitio web.

  • incremental_index

    El robot de búsqueda ejecuta un índice incremental utilizando la configuración que se establece en Index > Incremental Index > Configuration.

  • vertical_index

    El robot de búsqueda ejecuta una actualización vertical utilizando la configuración que se establece en Index > Vertical Update > Configuration.

    Consulte Acerca de la actualización vertical.

  • script_index

    El robot de búsqueda ejecuta un índice incremental utilizando el archivo de texto especificado en Index > Índice > Configuración.

  • full_staged_index

    El robot de búsqueda ejecuta un índice de ensayo completo de su sitio web.

  • incremental_staged_index

    El robot de búsqueda ejecuta un índice escalonado incremental utilizando la configuración que se establece en Index > Incremental Index > Configuration.

  • vertical_staged_index

    El robot de búsqueda ejecuta una actualización vertical escalonada utilizando la configuración establecida en Index > Vertical Update > Configuration.

Nota: Para utilizar Actualizaciones verticales, es posible que deba activarlo en su cuenta por parte del representante de cuentas de Adobe o por parte de la asistencia técnica de Adobe.

Consulte Acerca de la actualización vertical .

Puede anexar _saved a cualquiera de los valores sp_operation anteriores para que el robot de búsqueda intente utilizar contenido guardado. Por ejemplo, puede especificar lo siguiente:

sp_operation=full_index_saved

o

sp_operation=full_staged_index_saved

O bien, puede anexar _status a cualquiera de los valores sp_operation anteriores para solicitar un informe de estado para la operación actual o la más reciente. Por ejemplo, puede especificar lo siguiente:

sp_operation=full_index_status

o

sp_operation=full_staged_index_status

y los resultados se devuelven como un objeto JSON. Incluya sp_lines=N para incluir N líneas del archivo de registro asociado. Si N es negativo, se incluyen las últimas N líneas.

sp_operation= pushlive

Permite insertar de forma remota un índice escalonado.

Se ignora cualquier intento de anexar _saved a la operación push.

Cuando se ejecuta una operación pushlive , se devuelve al servidor una cadena de texto OK, Priority o Error response. Especifique estas cadenas de respuesta en la página Control remoto .

Consulte Configuración del control remoto para la indexación.

Si inserta en directo cuando no hay ningún índice de ensayo, no sucede nada y se devuelve la cadena de respuesta OK.

sp_password= xxxxxx

La contraseña del control remoto.

La búsqueda devuelve datos en forma de una respuesta HTTP adecuada. La respuesta completa está compuesta por un estado HTTP, encabezados de respuesta HTTP, una línea en blanco y la cadena de respuesta.

Por ejemplo, supongamos que realiza la siguiente solicitud de control remoto:

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index

La siguiente es la respuesta del servidor:

Status: 200 OK 
Content-type: text/plain 
OK

O bien, suponga que realiza la siguiente solicitud de estado de control remoto:

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status

La respuesta del servidor puede tener el siguiente aspecto:

Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T10:58:58-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "status": 1, 
    "message": "ok" 
}

Para obtener las diez primeras líneas del listado de registros asociado a esta operación de índice, junto con su estado, se utiliza la siguiente consulta:

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=10

La respuesta del servidor:

Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T10:59:30-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "offset": 672, 
    "lines": [ 
        "07/25 16:40:07 PST   ======== Starting manual crawl of account sp99999999. ========", 
        "07/25 16:40:08 PST   Loading existing data", 
        "07/25 16:40:08 PST   Downloading entrypoint https://www.atomz.com/", 
        "07/25 16:40:08 PST   Robots.txt exclude mask: https://www.atomz.com/snap", 
        "07/25 16:40:08 PST   Exclude mask: regexp ^https://www.atomz.com/$", 
        "07/25 16:40:08 PST   Include mask: https://www.atomz.com/", 
        "07/25 16:40:08 PST   Downloading https://www.atomz.com/style.css", 
        "07/25 16:40:09 PST   Ignoring https://www.atomz.com/style.css, document type 'text/css'.", 
        "07/25 16:40:09 PST   Downloading https://www.atomz.com/privacy.html", 
        "07/25 16:40:09 PST   Downloading https://www.atomz.com/terms.html" 
    ], 
    "status": 1, 
    "message": "ok" 
}

Tenga en cuenta el valor offset. Este valor identifica la posición de desplazamiento del archivo en el archivo de registro en el que la lectura dejó de funcionar. Para leer las siguientes diez líneas del archivo, debe incluir, en este ejemplo, &sp_offset=672 en la solicitud enviada al servidor.

Con sp_offset, puede desplazarse por un archivo de registro.

Para obtener las last diez líneas del registro, junto con el estado , especifique el recuento como un número negativo. Por ejemplo, especifique sp_lines= con un valor de -10 como en el siguiente:

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=-10

La respuesta del servidor:

Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T11:01:14-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "lines": [ 
        "07/25 16:40:20 PST   End Time: 07/25/2017 16:40:20 PST", 
        "07/25 16:40:20 PST   Elapsed Time: 13 seconds", 
        "07/25 16:40:20 PST   Pages Crawled: 3 pages", 
        "07/25 16:40:20 PST   Pages Indexed: 3 pages", 
        "07/25 16:40:20 PST   Words/Bytes Indexed: 2373 words/ 20618 bytes", 
        "07/25 16:40:20 PST   Errors: 0", 
        "07/25 16:40:20 PST   *** Index Summary ***", 
        "07/25 16:40:20 PST   Total Pages: 3", 
        "07/25 16:40:20 PST   --------------------------------------------------------------------", 
        "07/25 16:40:20 PST   ======== Finish manual crawl of account sp99999999: Done. ========" 
    ], 
    "status": 1, 
    "message": "ok" 
}

Tenga en cuenta que no hay ningún valor offset devuelto aquí, ya que esta operación ha finalizado al final del archivo y no hay más líneas que leer.

Configuración del control remoto para indexar

Siempre que cambie su sitio web, puede usar Control remoto para ejecutar un script o programa desde su servidor, solicitando que el robot de búsqueda ejecute un índice.

Para configurar el control remoto para la indexación

  1. En el menú del producto, haga clic en Index > Remote Control.

  2. En la página Remote Control, configure cada opción de campo de configuración para poder enviar una solicitud de indexación desde el servidor automáticamente para indexar el sitio web.

    Opción

    Descripción

    Contraseña de control remoto

    Especifique la contraseña del control remoto.

    Las contraseñas distinguen entre mayúsculas y minúsculas, tienen al menos seis caracteres de longitud y deben incluir al menos una letra. Se recomienda incluir al menos un número.

    No use la contraseña de inicio de sesión de búsqueda/comercialización del sitio.

    La contraseña se utiliza en cada solicitud de control remoto.

    Cadena de respuesta OK

    Permite especificar una cadena de texto de respuesta OK si la operación de índice solicitada comienza correctamente. En estos casos, el robot de búsqueda devuelve la cadena de respuesta OK al servidor.

    Cadena de respuesta de prioridad

    Si hay otra operación de indexación en curso cuando se realiza la solicitud remota, el robot de búsqueda no puede realizar el índice solicitado. En estos casos, la cadena de texto Priority response se devuelve al servidor.

    Cadena de respuesta de error

    Permite especificar una cadena de texto de respuesta de error Si la contraseña es incorrecta o si se produce otro error. En estos casos, el robot de búsqueda devuelve la cadena de respuesta de error al servidor.

  3. Haga clic Save Changes.

En esta página