Con Índice de secuencias de comandos puede escribir, actualizar y mantener opciones de indexación incrementales sin necesidad de iniciar sesión. El robot de búsqueda lee instrucciones de un archivo de texto alojado en el servidor.
Para utilizar el índice con secuencias de comandos, utilice la página Configuración del índice incremental con secuencias de comandos para especificar la URL de un archivo de secuencia de comandos (un archivo de texto sin formato) que se encuentra en el servidor. Por ejemplo, https://www.mysite.com/indexlist.txt
. A medida que el sitio cambie, puede agregar bloques de comandos al archivo de texto de forma manual o automática (con un script activado por la llegada de información de un suministro de noticias, un ticker de stock u otro archivo alterado).
Cuando comienza el índice incremental con secuencias de comandos, el robot de búsqueda lee el archivo de texto y ejecuta los nuevos comandos que se encuentran en ese archivo. De forma predeterminada, el robot de búsqueda procesa sólo los nuevos comandos, que están determinados por la fecha del archivo. A menos que marque Clear Date en el momento de configurar el índice de secuencias de comandos, el robot de búsqueda "recuerda" el especificador de fechas del bloque procesado más recientemente.
El archivo de secuencia de comandos especificado en la URL es un archivo de texto sin formato que se encuentra en el servidor. Puede utilizar retornos de carro, fuentes de línea o ambos para la secuencia de fin de línea. Una línea en blanco contiene cero o más caracteres de espacio en blanco seguidos de una secuencia de fin de línea. Todos los comandos no distinguen entre mayúsculas y minúsculas.
El archivo de texto está organizado en bloques que describen la información que utiliza el robot de búsqueda cuando realiza un índice incremental con secuencias de comandos.
Los bloques se ordenan por fecha, con los bloques más antiguos en la parte superior del archivo de texto y los bloques más recientes en la parte inferior. Cada bloque comienza con un comando date-command de una sola línea y un comando date-specifier, y termina con un separador de línea en blanco como en el siguiente ejemplo de bloque (entre hay varios comandos):
Se requiere un cero inicial para todas las fechas ordinales inferiores a la décima cuando se utiliza el estilo HTTP 1.1. Por ejemplo, el 6 de noviembre es el 6 de noviembre, no el 6 de noviembre.
Comando |
Descripción |
---|---|
date-command |
La primera línea de cada bloque comienza con uno de los dos comandos de fecha:
|
date-specifier |
El comando date-specifier generalmente registra la fecha y la hora ordinales (comando date) o la hora en segundos epoch (comando seconds) que la información de bloque se agregó al archivo. Por ejemplo: Se requiere un cero inicial para todas las fechas ordinales inferiores a la décima cuando se utiliza el estilo HTTP 1.1. Por ejemplo, el 6 de noviembre es el 6 de noviembre, no el 6 de noviembre. El robot de búsqueda "recuerda" el especificador de fecha del bloque procesado más recientemente y solo indexa la información que considera "más reciente". (El tiempo real no le importa al robot de búsqueda. En cambio, lo que importa es el tiempo en relación con otros tiempos procesados anteriormente). Por ejemplo, después de que el robot de búsqueda lea un bloque con un especificador de fecha de 10:00 p.m., no lee ningún bloque que registre tiempos antes de las 22:00, independientemente del momento en que se ejecute la operación de índice. En el peor de los casos, podría introducir erróneamente el año "2040" en lugar de "2004" en el especificador de fechas. En tal caso, el robot de búsqueda indexa el bloque 2040 durante la siguiente operación de indexación y luego se rehúsa a leer cualquier otro bloque de información (a menos que uno sea posterior a 2040). Si esto debería suceder, elimine todos los bloques procesados anteriormente del archivo de texto, haga clic en Borrar fecha y, a continuación, instálelo en vivo. |
línea de comentarios |
Empiece las líneas de comentario con el carácter "#". Cada línea de comentarios debe ser una línea propia; no puede escribir comentarios al final de línea. Una línea de comentario no se considera una línea en blanco. También puede aparecer en cualquier lugar de un bloque, incluso antes de un comando date o seconds como en el siguiente ejemplo: |
action-command |
Cada bloque de texto puede contener tantos comandos de acción como desee. Las siguientes opciones de acción-comando corresponden a las de la indexación incremental estándar:
|
Consulte también Acerca de las máscaras de URL.
En el siguiente ejemplo de archivo de secuencias de comandos, el robot de búsqueda procesa los bloques siempre que los especificadores de fechas posdaten el especificador de fechas del bloque procesado más recientemente. Si ese es el caso, se producen las siguientes operaciones de indexación:
Elimina y2k-problems.html
del índice.
Agrega no-y2k-problems.html
al índice de búsqueda y no sigue ninguno de los vínculos de no-y2k-problems.html
.
Durante el rastreo, excluya las direcciones URL que coincidan con housewares.htm
y lightfixtures.htm
l del índice de búsqueda.
Incluya todos los demás directorios y documentos en www.mydomain.com
.
Actualice todos los documentos dentro de los directorios products
y information
, rastreando e indexando todos los vínculos subsidiarios que han cambiado desde la última operación de indexación.
Durante el rastreo, excluya las direcciones URL de la sección archive
del sitio web si tienen fecha del 1 de enero de 1999 o antes de esa fecha.
Excluya las direcciones URL que coincidan con housewares.html
y lightfixtures.html
del índice de búsqueda.
Indexe archivos en el directorio help
, pero no rastree ni indexe ningún vínculo de esos archivos.
Arrastre e indexe cualquier otro archivo encontrado para www.mydomain.com
.
# Start of file.
# Added by John Smith
date Sat, 01 Jan 2004 16:05:53 PST
exclude https://www.mydomain.com/housewares.html
exclude https://www.mydomain.com/lightfixtures.html
include https://www.mydomain.com/
delete https://www.mydomain.com/y2k-problems.html
add https://www.mydomain.com/no-y2k-problems.html nofollow
date Sun, 02 Jan 2004 20:19:08 PST
# Added by the wire service updater
exclude-date 1999-01-01 https://www.mydomain.com/archive server-date
exclude https://www.mydomain.com/housewares.html
exclude https://www.mydomain.com/lightfixtures.html
include https://www.mydomain.com/help/ nofollow
include https://www.mydomain.com/
# no add files, just update existing files
# update all files in the "products" directory
update https://www.mydomain.com/products/
# update all files in the "information" directory
update regexp ^https://www\.mydomain\.com/information/.*$
# End of file.
Puede especificar un script que haya creado que escriba, actualice y mantenga un índice incremental, sin necesidad de iniciar sesión. El robot de búsqueda lee instrucciones del archivo de texto alojado en el servidor para realizar el índice incremental.
Para configurar un índice incremental con secuencias de comandos
En el menú del producto, haga clic en Index > Scripted Index > Configuration.
En la página Scripted Incremental Index Configuration, en Script File URL, introduzca la dirección URL del archivo de texto que se encuentra en el servidor.
(Opcional) Compruebe Clear Date si no desea que el robot de búsqueda "recuerde" el especificador de fecha del bloque procesado más recientemente.
De forma predeterminada, el robot de búsqueda procesa solo los bloques nuevos de comandos que se encuentran en el archivo de texto, que está determinado por la fecha del archivo. Si no desea el valor predeterminado, marque Clear Date.
Haga clic Save Changes.
(Opcional) Realice una de las siguientes acciones:
Haga clic en History para revertir cualquier cambio que haya realizado.
Consulte Uso de la opción Historial.
Haga clic Live.
Haga clic Push Live.
Consulte Inserción de la configuración del escenario en directo.
Puede programar la indexación incremental mediante secuencias de comandos para que se produzca a intervalos regulares durante todo el día.
La hora base que seleccione es local según la zona horaria configurada en Configuración de la cuenta.
Consulte Configuración de la cuenta.
Los servidores web suelen estar programados para su mantenimiento a mitad de la noche. Si el servidor está inactivo durante una hora de índice programada, el proceso de indexación fallará. Asegúrese de seleccionar una hora del día en la que el servidor web esté disponible.
La programación de índices solo se aplica a su índice activo; no puede programar índices incrementales por etapas.
Definición de la programación de índice incremental con secuencias de comandos para un sitio web activo
Puede utilizar el índice incremental con secuencias de comandos para indexar "partes" de su sitio web activo o provisional, como una colección de páginas modificadas con frecuencia, sin necesidad de iniciar sesión.
Para utilizar esta función, asegúrese de que ha configurado un archivo de texto de índice incremental con secuencias de comandos.
Consulte Configuración de un índice incremental con secuencias de comandos.
Ejecutar un índice incremental con secuencias de comandos de un sitio web activo o escalonado
En el menú del producto, realice una de las siguientes acciones:
Haga clic Scripted Index Now.
(Opcional) Si se produjeron errores de indexación, haga clic en View Errors para ver el registro asociado.
Cuando se completa un índice de secuencia de comandos completo activo o un índice de secuencia de comandos completa por etapas, puede ver su registro asociado para solucionar cualquier error que se haya producido.
No puede exportar registros ni guardarlos. Sin embargo, el registro permanece disponible para su visualización hasta que se produzca el nuevo índice.
Para ver el registro de índice incremental de un sitio web activo o provisional
En el menú del producto, realice una de las siguientes acciones:
Haga clic en Index > Scripted Index > Live Log.
Haga clic en Index > Scripted Index > Staged Log.
En la página de registro, en la parte superior o inferior, realice una de las acciones siguientes:
Utilice las opciones de navegación First, Prev, Next, Last o Go to line para desplazarse por el registro.
Utilice las opciones de visualización Errors only, Wrap line o Show para restringir lo que ve.