Acerca del índice incremental

Puede usar el Índice incremental para indexar "partes" de su sitio web activo o provisional, como una colección de páginas modificadas con frecuencia.

Uso del índice incremental

Un índice incremental tarda solo segundos en funcionar y es útil en sitios web de gran capacidad que pueden tardar muchas horas en indexarse por completo.

Cuando se genera un índice incremental, se muestra la información de estado, como la hora de inicio, el tiempo transcurrido y los errores durante el proceso de indexación. También se muestra información sobre el estado del último índice.

Puede detener o reiniciar el proceso de indexación incremental en cualquier momento.

Mientras el nuevo índice incremental se crea para el sitio web activo, los clientes pueden seguir buscando en el sitio utilizando el último índice incremental.

Configuración del índice incremental de un sitio web escalonado

Puede configurar qué páginas del sitio web desea incluir en el índice incremental especificando las direcciones URL del sitio web y las máscaras de URL.

Para configurar un índice incremental de un sitio web escalonado

  1. En el menú del producto, haga clic en Index > Incremental Index > Configuration.

  2. En la página Incremental Index Configuration, utilice los distintos campos para especificar qué páginas desea indexar.

    Campo

    Descripción

    Agregar o actualizar direcciones URL

    Especifique las direcciones URL.

    El robot de búsqueda solo indexa los documentos especificados que han cambiado desde la última vez que indexó.

    Además, el robot de búsqueda sigue los vínculos que están contenidos dentro de los documentos especificados e indexa solamente aquellos documentos que han cambiado.

    Este campo debe contener únicamente direcciones URL del documento y no máscaras, como en el siguiente ejemplo:

    https://www.mydomain.com/products/new.html

    Puede utilizar las siguientes palabras clave con la dirección URL:

    • noindex

      Si no desea indexar el texto de la página que coincida con una dirección URL especificada, pero desea seguir los vínculos de la página, agregue noindex después de la dirección URL, como en el siguiente ejemplo:

      https://www.mydomain.com/products/new.html noindex

      Asegúrese de separar noindex desde la dirección URL con un espacio; una coma no es un separador válido.

    • nofollow

      Si desea indexar el texto de la página que coincida con la dirección URL especificada, pero no desea seguir los vínculos de la página, agregue nofollow después de la dirección URL, como en el siguiente ejemplo:

      https://www.mydomain.com/products/new.html nofollow

      Asegúrese de separar nofollow desde la dirección URL con un espacio; una coma no es un separador válido.

    Buscar y actualizar máscaras de URL

    Especifique máscaras de URL simples: ruta completa, ruta parcial o rutas que utilizan comodines o expresiones regulares.

    El robot de búsqueda encuentra todos los documentos e índices coincidentes solamente aquellos documentos que han cambiado desde la última vez que indexó.

    Además, el robot de búsqueda sigue los vínculos que están contenidos dentro de los documentos coincidentes e indexa solamente las páginas que han cambiado. Por ejemplo:

    https://www.mydomain.com/products/household/*.html

    También puede utilizar expresiones regulares como en el siguiente ejemplo:

    regexp ^https://www\.mydomain\.com/products/household/.*\.html$

    Consulte Expresiones regulares.

    También puede utilizar las palabras clave nofollow y noindex tal como se describe en Agregar o actualizar direcciones URL más arriba.

    Incluir y excluir máscaras de URL

    Especifique máscaras de URL de inclusión o exclusión simples: ruta completa, ruta parcial o rutas que utilizan comodines o expresiones regulares.

    El robot de búsqueda encuentra e indexa ("incluir") o ignora ("excluir") documentos según el tipo de máscara especificada.

    Al indexar un sitio, se siguen las indicaciones en orden de aparición. Por ejemplo, la siguiente lista de máscaras:

    include https://www.mydomain.com/products/household/lightbulbs*.html

    exclude https://www.mydomain.com/products/

    indexa las páginas lightbulbs1.html y lightbulbs2.html . Sin embargo, no indexa ninguna otra página que aparezca bajo el directorio de productos.

    Una máscara de URL que aparece primero siempre tiene prioridad sobre una que aparece más adelante en la lista. Además, si el robot de búsqueda encuentra un documento que coincide con una máscara de inclusión y una máscara de exclusión, la máscara que aparece en primer lugar tiene prioridad.

    También puede utilizar las palabras clave nofollow y noindex tal como se describe en Agregar o actualizar direcciones URL más arriba.

    Consulte Acerca de las máscaras de URL.

    Incluir y Excluir máscaras de fecha

    Especifique máscaras de fechas simples de incluir o excluir: ruta completa, ruta parcial o rutas que utilizan comodines o expresiones regulares.

    El robot de búsqueda encuentra e indexa ("incluir") o ignora ("excluir") documentos en función de la dirección URL y la fecha de los documentos.

    Puede utilizar los siguientes tipos de máscaras de fecha:

    • include-days NNN

      El robot de búsqueda indexa todos los documentos que coinciden con la máscara de URL especificada y que son NNN días o más antiguos.

      Puede seguir la máscara de URL con una o más de las siguientes palabras clave:

      • noseguir
      • noindex
      • server-date

      Por ejemplo, la siguiente máscara incluye todos los documentos de la carpeta /archive/support que tengan 0 días o más:

      include-days 0 https://www.mydomain.com/archive/support/

    • include-date YYYY-MM-DD

      El robot de búsqueda indexa todos los documentos que coinciden con la máscara de dirección URL especificada y que son tan antiguos o antiguos como la fecha AAAA-MM-DD.

      Puede seguir la máscara de URL con una o más de las siguientes palabras clave:

      • noseguir
      • noindex
      • server-date

      El siguiente ejemplo de máscara incluye todos los documentos de la carpeta /archive/ con fecha del 25 de julio de 2011 o anterior a esta:

      include-date 2011-07-25 https://www.mydomain.com/archive/

    • exclude-days NNN

      Deshabilite la indexación de todos los documentos que coincidan con la máscara de URL especificada y que tengan NNN días o más de antigüedad.

      Opcionalmente, puede seguir la máscara de URL por palabra clave server-date .

      El siguiente ejemplo de máscara excluye de su índice todos los archivos PDF que tengan 90 días o más de antigüedad:

      exclude-days 90 *.pdf

    • exclude-date YYYY-MM-DD

      Deshabilite la indexación de todos los documentos que coincidan con la máscara de URL especificada y que tengan la antigüedad o la antigüedad anterior a la fecha AAAA-MM-DD.

      Opcionalmente, puede seguir la máscara de URL por palabra clave server-date .

      El siguiente ejemplo de máscara excluye todos los documentos de la carpeta /archive/ con fecha del 23 de abril de 2004 o anterior:

      exclude-date 2004-04-23 https://www.mydomain.com/archive/

    Consulte Acerca de las máscaras de fecha.

    Eliminar direcciones URL

    Especifique las direcciones URL.

    El robot de búsqueda encuentra y elimina los documentos especificados de su índice de búsqueda. Si una página especificada ya está en el índice de búsqueda, el robot la eliminará antes de agregar o actualizar cualquier otra página.

    Este campo solo debe contener direcciones URL del documento y no máscaras.

    Buscar y eliminar máscaras de URL

    Especifique máscaras de URL simples: ruta completa, ruta parcial o que usan comodines o expresiones regulares.

    Si la máscara de URL especificada coincide con páginas en el índice de búsqueda, el robot de búsqueda elimina las páginas antes de agregar o actualizar cualquier otra página. Por ejemplo:

    https://www.mydomain.com/products/1998/household/*

    También puede utilizar expresiones regulares como en el siguiente ejemplo:

    regexp ^https://www\.mydomain\.com/products/199[567]/.*$

    Consulte Expresiones regulares.

  3. Haga clic Save Changes.

  4. (Opcional) Realice una de las siguientes acciones:

Configuración de la programación de índice incremental para un sitio web activo

Puede seleccionar la frecuencia del índice incremental y el tiempo base que se utiliza para rastrear y actualizar su índice incremental.

La hora seleccionada es local según la zona horaria configurada en Configuración de la cuenta.

Consulte Configuración de la cuenta.

Los servidores web suelen estar programados para su mantenimiento a mitad de la noche. Si el servidor está inactivo durante una hora de índice programada, el proceso de indexación fallará. Asegúrese de seleccionar una hora del día en la que el servidor web esté disponible.

La programación de índices solo se aplica a su índice activo; no puede programar índices por etapas.

Configuración de la programación de índice incremental de un sitio web activo

  1. En el menú del producto, haga clic en Index > Incremental Index > Live Schedule.
  2. En la página Incremental Index Schedule, en la lista desplegable Incrementally Index, seleccione la frecuencia de indexación en horas o minutos.
  3. En la lista desplegable Base Time, seleccione la hora de inicio en la que desea volver a generar un nuevo índice incremental.
  4. Haga clic Save Changes.

Ejecución de un índice incremental de un sitio web activo o por etapas

Puede usar el Índice incremental para indexar "partes" de su sitio web activo o provisional, como una colección de páginas modificadas con frecuencia.

Ejecutar un índice incremental de un sitio web activo o provisional

  1. En el menú del producto, realice una de las siguientes acciones:

    • Haga clic en Index > Incremental Index > Live Index.

    • Haga clic en Index > Incremental Index > Staged Index.

  2. Haga clic Incremental Index Now.

  3. (Opcional) Si se produjeron errores de indexación, haga clic en View Errors para ver el registro asociado.

Visualización del registro de índice incremental de un sitio web activo o por etapas

Cuando se completa un índice incremental activo o un índice incremental escalonado, puede ver su registro asociado para solucionar cualquier error que se haya producido.

No puede exportar registros ni guardarlos. El registro permanece disponible para su visualización hasta que se produzca el nuevo índice.

Para ver el registro de índice incremental de un sitio web activo o provisional

  1. En el menú del producto, realice una de las siguientes acciones:

    • Haga clic en Index > Incremental Index > Live Log.

    • Haga clic en Index > Incremental Index > Staged Log.

  2. En la página de registro, en la parte superior o inferior, realice una de las acciones siguientes:

    • Utilice las opciones de navegación First, Prev, Next, Last o Go to line para desplazarse por el registro.

    • Utilice las opciones de visualización Errors only, Wrap line o Show para restringir lo que ve.

En esta página