Sobre o Índice Incremental

Você pode usar o Índice incremental para indexar "partes" de seu site ativo ou temporário, como uma coleção de páginas alteradas com frequência.

Usando o Índice Incremental

Um índice incremental demora apenas segundos para ser executado e é útil em sites de grande capacidade que podem levar muitas horas para ser indexados completamente.

Quando você gera um índice incremental, as informações de status são exibidas, como tempo de início, tempo decorrido e erros durante o processo de indexação. As informações sobre o status do último índice também são exibidas.

Você pode interromper ou reiniciar o processo de indexação incremental a qualquer momento.

Embora o novo índice incremental seja criado para seu site ativo, os clientes podem continuar a pesquisar seu site usando seu último índice incremental.

Configurar um índice incremental de um site preparado

Você pode configurar quais páginas do site deseja incluir em seu índice incremental especificando URLs de site e máscaras de URL.

Para configurar um índice incremental de um site preparado

  1. No menu do produto, clique em Index > Incremental Index > Configuration.

  2. Na página Incremental Index Configuration , use os vários campos para especificar quais páginas deseja indexar.

    Campo

    Descrição

    Adicionar ou atualizar URLs

    Especifique URLs.

    O robô de pesquisa indexa apenas os documentos especificados que foram alterados desde a última vez que você indexou.

    Além disso, o robô de pesquisa segue os links contidos nos documentos especificados e indexa apenas os documentos que foram alterados.

    Este campo deve conter somente URLs de documento e não máscaras, como no exemplo a seguir:

    https://www.mydomain.com/products/new.html

    Você pode usar as seguintes palavras-chave com o URL:

    • noindex

      Se você não quiser indexar o texto na página que corresponde a um URL especificado, mas quiser seguir os links da página, adicione noindex após o URL, como no exemplo a seguir:

      https://www.mydomain.com/products/new.html noindex

      Certifique-se de separar noindex do URL com um espaço; uma vírgula não é um separador válido.

    • nofollow

      Se você deseja indexar o texto na página que corresponde ao URL especificado, mas não deseja seguir os links da página, adicione nofollow após o URL, como no exemplo a seguir:

      https://www.mydomain.com/products/new.html nofollow

      Certifique-se de separar nofollow do URL com um espaço; uma vírgula não é um separador válido.

    Localizar e atualizar máscaras de URL

    Especifique máscaras de URL simples: caminho completo, caminho parcial ou caminhos que usam curingas ou expressões regulares.

    O robô de pesquisa encontra todos os documentos e índices correspondentes apenas os que foram alterados desde a última vez que você indexou.

    Além disso, o robô de pesquisa segue os links contidos nos documentos correspondentes e indexa apenas as páginas que foram alteradas. Por exemplo:

    https://www.mydomain.com/products/household/*.html

    Também é possível usar expressões regulares como no exemplo a seguir:

    regexp ^https://www\.mydomain\.com/products/household/.*\.html$

    Consulte Expressões regulares.

    Também é possível usar as palavras-chave nofollow e noindex conforme descrito em Adicionar ou atualizar URLs acima.

    Incluir e excluir máscaras de URL

    Especifique máscaras simples de inclusão ou exclusão de URL: caminho completo, caminho parcial ou caminhos que usam curingas ou expressões regulares.

    O robô de pesquisa encontra e indexa ("include") ou ignora ("exclude") documentos com base no tipo de máscara especificada.

    Ao indexar um site, as instruções são seguidas na ordem de aparência. Por exemplo, a seguinte lista de máscaras:

    include https://www.mydomain.com/products/household/lightbulbs*.html

    exclude https://www.mydomain.com/products/

    indexa as páginas lightbulbs1.html e lightbulbs2.html . No entanto, ele não indexa nenhuma outra página que esteja listada no diretório de produtos.

    Uma máscara de URL que aparece primeiro sempre tem precedência sobre uma que aparece mais tarde na lista. Além disso, se o robô de pesquisa encontrar um documento que corresponda a uma máscara de inclusão e uma máscara de exclusão, a máscara listada primeiro terá prioridade.

    Também é possível usar as palavras-chave nofollow e noindex conforme descrito em Adicionar ou atualizar URLs acima.

    Consulte Sobre máscaras de URL.

    Incluir e excluir máscaras de data

    Especifique máscaras de data simples de inclusão ou exclusão: caminho completo, caminho parcial ou caminhos que usam curingas ou expressões regulares.

    O robô de pesquisa encontra e indexa ("include") ou ignora ("exclude") documentos com base no URL e na data dos documentos.

    Você pode usar os seguintes tipos de máscaras de data:

    • include-days NNN

      O robô de pesquisa indexa todos os documentos que correspondem à máscara de URL especificada e são NNN dias ou mais antigos.

      Você pode seguir a máscara de URL com uma ou mais das seguintes palavras-chave:

      • nofollow
      • noindex
      • data do servidor

      Por exemplo, a seguinte máscara inclui todos os documentos na pasta /archive/support que tenham 0 dias ou mais:

      include-days 0 https://www.mydomain.com/archive/support/

    • include-date YYYY-MM-DD

      O robô de pesquisa indexa todos os documentos que correspondem à máscara de URL especificada e são tão antigos ou mais antigos que a data AAAA-MM-DD.

      Você pode seguir a máscara de URL com uma ou mais das seguintes palavras-chave:

      • nofollow
      • noindex
      • data do servidor

      O exemplo de máscara a seguir inclui todos os documentos na pasta /archive/ com data de 25 de julho de 2011 ou anterior:

      include-date 2011-07-25 https://www.mydomain.com/archive/

    • exclude-days NNN

      Desative a indexação de todos os documentos que correspondem à máscara de URL especificada e são NNN dias ou mais antigos.

      Como opção, você pode seguir a máscara de URL pela palavra-chave server-date .

      O exemplo de máscara a seguir exclui todos os arquivos PDF com 90 dias ou mais de seu índice:

      exclude-days 90 *.pdf

    • exclude-date YYYY-MM-DD

      Desative a indexação de todos os documentos que correspondem à máscara de URL especificada e que são tão antigos ou mais antigos que a data AAAA-MM-DD.

      Como opção, você pode seguir a máscara de URL pela palavra-chave server-date .

      O exemplo de máscara a seguir exclui todos os documentos na pasta /archive/ datada de ou antes de 23 de abril de 2004:

      exclude-date 2004-04-23 https://www.mydomain.com/archive/

    Consulte Sobre máscaras de data.

    Excluir URLs

    Especifique URLs.

    O robô de pesquisa encontra e exclui os documentos especificados do seu índice de pesquisa. Se uma página especificada já estiver no índice de pesquisa, o robô a excluirá antes de adicionar ou atualizar quaisquer outras páginas.

    Este campo deve conter somente URLs de documento, e não máscaras.

    Localizar e excluir máscaras de URL

    Especifique máscaras de URL simples: caminho completo, caminho parcial ou que usam curingas ou expressões regulares.

    Se a máscara de URL especificada corresponder às páginas no seu índice de pesquisa, o robô de pesquisa excluirá as páginas antes de adicionar ou atualizar quaisquer outras páginas. Por exemplo:

    https://www.mydomain.com/products/1998/household/*

    Também é possível usar expressões regulares como no exemplo a seguir:

    regexp ^https://www\.mydomain\.com/products/199[567]/.*$

    Consulte Expressões regulares.

  3. Clique em Save Changes.

  4. (Opcional) Siga um destes procedimentos:

Configurar o agendamento de índice incremental para um site ativo

Você pode selecionar a frequência do Índice incremental e o tempo base usado para rastrear e atualizar seu índice incremental.

O horário selecionado é local de acordo com o fuso horário configurado nas Configurações da conta.

Consulte Definição das configurações da sua conta.

Os servidores da Web geralmente são agendados para serem mantidos no meio da noite. Se o servidor estiver inativo durante um tempo de índice agendado, o processo de indexação falhará. Certifique-se de selecionar uma hora do dia em que o servidor da Web está disponível.

O agendamento de índice se aplica somente ao seu índice ativo; não é possível agendar índices preparados.

Para definir o agendamento de índice incremental para um site ativo

  1. No menu do produto, clique em Index > Incremental Index > Live Schedule.
  2. Na página Incremental Index Schedule , na lista suspensa Incrementally Index, selecione a frequência de indexação em horas ou minutos.
  3. Na lista suspensa Base Time, selecione a hora inicial em que deseja gerar novamente um novo índice incremental.
  4. Clique em Save Changes.

Executando um índice incremental de um site ativo ou temporário

Você pode usar o Índice incremental para indexar "partes" de seu site ativo ou temporário, como uma coleção de páginas alteradas com frequência.

Para executar um índice incremental de um site ativo ou temporário

  1. No menu do produto, siga um destes procedimentos:

    • Clique em Index > Incremental Index > Live Index.

    • Clique em Index > Incremental Index > Staged Index.

  2. Clique em Incremental Index Now.

  3. (Opcional) Se ocorreram erros de indexação, clique em View Errors para visualizar o log associado.

Visualização do log de índice incremental de um site ativo ou temporário

Quando um índice incremental ao vivo ou um índice incremental por etapas é concluído, você pode exibir seu log associado para solucionar problemas que ocorreram.

Não é possível exportar logs nem salvá-los. O log permanece disponível para exibição até que o novo índice ocorra.

Para exibir o log de índice incremental de um site ativo ou temporário

  1. No menu do produto, siga um destes procedimentos:

    • Clique em Index > Incremental Index > Live Log.

    • Clique em Index > Incremental Index > Staged Log.

  2. Na página de log, na parte superior ou inferior, execute um dos seguintes procedimentos:

    • Use as opções de navegação First, Prev, Next, Last ou Go to line para percorrer o log.

    • Use as opções de exibição Errors only, Wrap line ou Show para refinar o que você vê.

Nesta página