Sempre que seu site muda, você pode executar um script ou programa solicitando que o robô de pesquisa execute um índice usando o controle remoto.
Normalmente, a solicitação de indexação do controle remoto provém de um script ou de um programa localizado no servidor.
O robô executa as mesmas etapas de indexação como se tivesse sido iniciado manualmente pelo menu Index. Para enviar uma solicitação de controle remoto, configure a senha e as sequências de caracteres de resposta necessárias.
Para fazer uma solicitação de controle remoto, use os seguintes exemplos de formato com base na localização do seu data center:
Localização do centro de dados |
Exemplo |
---|---|
Londres |
|
América do Norte |
|
Singapura |
|
ou
String e valor |
Descrição |
---|---|
sp_a= sp9999999 |
O número da sua conta. Você pode encontrar seu número de conta em Settings > Opções de Conta > Configurações de Conta . |
sp_lines= N |
Permite verificar o status de um rastreamento de índice em execução. N é um número inteiro positivo ou todos . Se esse for um valor numérico, as últimas linhas N do arquivo de log de índice correspondente serão incluídas na resposta JSON. Se o valor for todos os , o arquivo inteiro será retornado. Se o valor for 0 , nenhuma informação de log será retornada. Esse valor é o padrão para um query de status de índice em execução. |
sp_operation= op |
Permite que você especifique uma das seguintes operações de indexação que deseja executar:
Observação: Para usar as Atualizações verticais, talvez seja necessário ativá-las em sua conta pelo representante de conta do Adobe ou pelo Suporte ao Adobe. Consulte Sobre a atualização vertical . Você pode anexar _saved a qualquer um dos valores sp_operation acima para que o robô de pesquisa tente usar o conteúdo salvo. Por exemplo, você pode especificar o seguinte: ou Ou você pode anexar _status a qualquer um dos valores sp_operation acima para solicitar um relatório de status para a operação atual ou mais recente. Por exemplo, você pode especificar o seguinte: ou e os resultados são retornados como um objeto JSON. Inclua sp_lines=N para incluir N linhas do arquivo de log associado. Se N for negativo, as últimas N linhas serão incluídas. |
sp_operation= pushlive |
Permite que você envie ao vivo remotamente um índice de preparo. Qualquer tentativa de anexar _saved à operação ativa de envio é ignorada. Quando você executa uma operação pushlive , uma string de texto de resposta OK, Priority ou Error é retornada ao servidor. Especifique essas sequências de caracteres de resposta na página Controle remoto . Consulte Configurando o controle remoto para indexação. Se você mover ao vivo quando não houver um índice de preparo, nada acontecerá e a sequência de caracteres de resposta OK será retornada. |
sp_password= xxxxx |
A senha do controle remoto. |
A pesquisa retorna dados na forma de uma resposta HTTP adequada. A resposta completa é composta de um status HTTP, cabeçalhos de resposta HTTP, uma linha em branco e a string de resposta.
Por exemplo, suponha que você execute a seguinte solicitação de controle remoto:
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index
A seguir está a resposta do servidor:
Status: 200 OK
Content-type: text/plain
OK
Ou suponha que você execute a seguinte solicitação de status de controle remoto:
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status
A resposta do servidor pode ser semelhante ao seguinte:
Status: 200 OK
Content-type: application/json; charset=utf-8
{
"current_time": "2017-08-27T10:58:58-0700",
"start_time": "2017-07-25T16:40:07-0800",
"end_time": "2017-07-25T16:40:20-0800",
"elapsed_seconds": 13,
"elapsed_seconds_fmt": "13s",
"state": "finished",
"docs_indexed": 3,
"depth": 0,
"errors": 0,
"status": 1,
"message": "ok"
}
Para obter as primeiras dez linhas da listagem de log associadas à operação de índice, juntamente com seu status, o seguinte query é usado:
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=10
A resposta do servidor:
Status: 200 OK
Content-type: application/json; charset=utf-8
{
"current_time": "2017-08-27T10:59:30-0700",
"start_time": "2017-07-25T16:40:07-0800",
"end_time": "2017-07-25T16:40:20-0800",
"elapsed_seconds": 13,
"elapsed_seconds_fmt": "13s",
"state": "finished",
"docs_indexed": 3,
"depth": 0,
"errors": 0,
"offset": 672,
"lines": [
"07/25 16:40:07 PST ======== Starting manual crawl of account sp99999999. ========",
"07/25 16:40:08 PST Loading existing data",
"07/25 16:40:08 PST Downloading entrypoint https://www.atomz.com/",
"07/25 16:40:08 PST Robots.txt exclude mask: https://www.atomz.com/snap",
"07/25 16:40:08 PST Exclude mask: regexp ^https://www.atomz.com/$",
"07/25 16:40:08 PST Include mask: https://www.atomz.com/",
"07/25 16:40:08 PST Downloading https://www.atomz.com/style.css",
"07/25 16:40:09 PST Ignoring https://www.atomz.com/style.css, document type 'text/css'.",
"07/25 16:40:09 PST Downloading https://www.atomz.com/privacy.html",
"07/25 16:40:09 PST Downloading https://www.atomz.com/terms.html"
],
"status": 1,
"message": "ok"
}
Observe o valor offset
. Esse valor identifica a posição de deslocamento do arquivo no arquivo de log, onde a leitura ficou desativada. Para ler as dez linhas ao lado no arquivo, inclua, neste exemplo, &sp_offset=672
na solicitação enviada para o servidor.
Usando sp_offset
, você pode navegar efetivamente por um arquivo de log.
Para obter as last dez linhas do log, juntamente com o status, especifique a contagem como um número negativo. Por exemplo, especifique sp_lines=
com um valor de -10
como no seguinte:
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=-10
A resposta do servidor:
Status: 200 OK
Content-type: application/json; charset=utf-8
{
"current_time": "2017-08-27T11:01:14-0700",
"start_time": "2017-07-25T16:40:07-0800",
"end_time": "2017-07-25T16:40:20-0800",
"elapsed_seconds": 13,
"elapsed_seconds_fmt": "13s",
"state": "finished",
"docs_indexed": 3,
"depth": 0,
"errors": 0,
"lines": [
"07/25 16:40:20 PST End Time: 07/25/2017 16:40:20 PST",
"07/25 16:40:20 PST Elapsed Time: 13 seconds",
"07/25 16:40:20 PST Pages Crawled: 3 pages",
"07/25 16:40:20 PST Pages Indexed: 3 pages",
"07/25 16:40:20 PST Words/Bytes Indexed: 2373 words/ 20618 bytes",
"07/25 16:40:20 PST Errors: 0",
"07/25 16:40:20 PST *** Index Summary ***",
"07/25 16:40:20 PST Total Pages: 3",
"07/25 16:40:20 PST --------------------------------------------------------------------",
"07/25 16:40:20 PST ======== Finish manual crawl of account sp99999999: Done. ========"
],
"status": 1,
"message": "ok"
}
Observe que não há valor offset
retornado aqui, pois essa operação terminou no final do arquivo e não há mais linhas para ler.
Sempre que seu site muda, você pode usar o Controle remoto para executar um script ou programa do servidor, solicitando que o robô de pesquisa execute um índice.
Configuração do controle remoto para indexação
No menu do produto, clique em Index > Remote Control.
Na página Remote Control, defina cada opção de campo de configuração para poder enviar uma solicitação de indexação do servidor automaticamente para indexar seu site.
Opção |
Descrição |
---|---|
Senha do controle remoto |
Especifique a senha do controle remoto. As senhas diferenciam maiúsculas de minúsculas, têm pelo menos seis caracteres e devem incluir pelo menos uma letra. É recomendável incluir pelo menos um número. Não use a senha de logon de pesquisa/comercialização do site. Sua senha é usada em cada solicitação de controle remoto. |
Sequência de Resposta OK |
Permite que você especifique uma string de texto de resposta OK se a operação de índice solicitada começar com êxito. Nesses casos, o robô de pesquisa retorna a sequência de caracteres de resposta OK ao servidor. |
String de resposta de prioridade |
Se outra operação de indexação estiver em andamento quando a solicitação remota for feita, o robô de pesquisa não poderá executar o índice solicitado. Nesses casos, sua sequência de texto de resposta Prioridade é retornada ao servidor. |
String de resposta de erro |
Permite que você especifique uma sequência de texto de resposta de erro Se a senha estiver incorreta ou se ocorrer outro erro. Nesses casos, o robô de pesquisa retorna a sequência de caracteres de resposta Erro ao servidor. |
Clique em Save Changes.