Configurar a detecção de bot para sequências de dados
O tráfego não humano de programas automatizados, raspadores da Web, aranhas e scanners com script pode dificultar a identificação de eventos de visitantes humanos. Esse tipo de tráfego pode afetar negativamente métricas comerciais importantes, resultando em relatórios de tráfego incorretos.
A detecção de bot permite identificar eventos gerados pelo SDK da Web, SDK Móvel e Server API como sendo gerados pelos spiders e bots conhecidos.
Ao configurar a detecção de bot para seus fluxos de dados, você pode identificar endereços IP específicos, intervalos IP e cabeçalhos de solicitação para classificar como eventos de bot. Isso ajuda a fornecer uma medida mais precisa da atividade do usuário no seu site ou aplicativo móvel.
Quando uma solicitação para o Edge Network corresponde a qualquer uma das regras de detecção de bot, o esquema XDM é atualizado com uma pontuação de bot (sempre definida como 1), conforme mostrado abaixo:
{
"botDetection": {
"score": 1
}
}
Essa pontuação de bot ajuda as soluções que recebem a solicitação a identificar corretamente o tráfego de bot.
As regras de detecção de bot podem levar até 15 minutos para se propagarem pelo Edge Network após serem criadas.
Pré-requisitos prerequisites
Para que a detecção de bot funcione na sequência de dados, é necessário adicionar o grupo de campos Informações de Detecção de Bot ao esquema. Consulte a documentação do esquema XDM para saber como adicionar grupos de campos a um esquema.
Configurar a detecção de bot para sequências de dados configure
Você pode configurar a detecção de bot após criar uma configuração de sequência de dados. Consulte a documentação sobre como criar e configurar uma sequência de dados e, em seguida, siga as instruções abaixo para adicionar recursos de detecção de bot à sua sequência de dados.
Vá para a lista de sequências de dados e selecione a sequência de dados à qual deseja adicionar a detecção de bot.
Na página de detalhes da sequência de dados, selecione a opção Detecção de bot no painel direito.
A página Regras de detecção de bot é exibida.
Na página Regras de detecção de bot, você pode configurar a detecção de bot usando as seguintes funcionalidades:
- Usando o [IAB/ABC International Spiders and Bots List].
- Criar suas próprias regras de detecção de bot.
Usar a Lista Internacional de spiders e bots da IAB/ABC iab-list
A Lista Internacional de Aranhas e Bots do IAB/ABC é uma lista de spiders e bots da Internet padrão do setor de terceiros. Essa lista ajuda a identificar o tráfego automatizado, como rastreadores de mecanismo de pesquisa, ferramentas de monitoramento e outro tráfego não humano que talvez você não queira incluir nas contagens de análise.
Para configurar seu fluxo de dados para usar a Lista internacional de spiders e bots da IAB/ABC:
- Ative a opção Usar Lista Internacional de spiders e bots IAB/ABC para detecção de bot nesta sequência de dados.
- Selecione Salvar para aplicar as configurações de detecção de bot à sua sequência de dados.
Criar regras de detecção de bot rules
Além de usar a Lista Internacional de spiders e bots do IAB/ABC, você pode definir suas próprias regras de detecção de bot para cada sequência de dados.
Você pode criar regras de detecção de bot com base em endereços IP e intervalos de endereço IP.
Se você precisar de regras de detecção de bot mais granulares, poderá combinar as condições de IP com as condições do cabeçalho da solicitação. As regras de detecção de bot podem usar os seguintes cabeçalhos:
user-agent
content-type
referer
sec-ch-ua
sec-ch-ua-mobile
sec-ch-ua-platform
sec-ch-ua-platform-version
sec-ch-ua-arch
sec-ch-ua-model
sec-ch-ua-bitness
sec-ch-ua-wow64
Para criar uma regra de detecção de bot, siga as etapas abaixo:
-
Selecione Adicionar Nova Regra.
-
Digite um nome para a regra no campo Nome da Regra.
-
Selecione Adicionar nova condição de IP para adicionar uma nova regra baseada em IP. Você pode definir a regra por endereço IP ou por intervalo de endereços IP.
note tip TIP As condições de IP são baseadas em uma operação OR
lógica. Uma solicitação é marcada como originária de um bot se corresponder a qualquer uma das condições de IP definidas. -
Se quiser adicionar condições de cabeçalho à regra, selecione Adicionar grupo de condições de cabeçalho e selecione os cabeçalhos que deseja que a regra use.
Em seguida, adicione as condições a serem usadas para o cabeçalho selecionado.
-
Depois de configurar as regras de detecção de bot desejadas, selecione Salvar para aplicar as regras à sua sequência de dados.
Exemplos de regras de detecção de bot examples
Para ajudar você a começar a usar a detecção de bot, use os exemplos detalhados abaixo para criar regras de detecção de bot.
Detecção de bot com base em um endereço IP one-ip
Para marcar todas as solicitações originadas de um endereço IP específico como tráfego de bot, crie uma nova regra de detecção de bot que avalia um único endereço IP, conforme mostrado na imagem abaixo.
Detecção de bot com base em dois endereços IP two-ip
Para marcar todas as solicitações originadas de um dos dois endereços IP específicos como tráfego de bot, crie uma nova regra de detecção de bot que avalia dois endereços IP, conforme mostrado na imagem abaixo.
Detecção de bot com base em um intervalo de endereços IP range
Para marcar todas as solicitações originadas de qualquer endereço IP em um intervalo específico como tráfego de bot, crie uma nova regra de detecção de bot que avalia um intervalo de endereços IP inteiro, como mostrado na imagem abaixo.
Detecção de bot com base em um endereço IP e um cabeçalho de solicitação ip-header
Para marcar todas as solicitações originadas de um endereço IP específico e que contenham um cabeçalho de solicitação específico como tráfego de bot, crie uma nova regra de detecção de bot, conforme mostrado na imagem abaixo.
Esta regra verifica se a solicitação se origina de um endereço IP específico e se o cabeçalho da solicitação referer
começa com www.adobe.com
.
Detecção de bot com base em várias condições multiple-conditions
Você pode criar regras de detecção de bot com base em:
- Várias condições diferentes: condições diferentes são avaliadas como uma operação
AND
lógica, o que significa que as condições precisam ser atendidas simultaneamente para que a solicitação seja identificada como originária de um bot. - Várias condições do mesmo tipo: condições do mesmo tipo são avaliadas como uma operação
OR
lógica, o que significa que, se qualquer uma das condições for atendida, a solicitação será identificada como originária de um bot.
A regra mostrada na imagem abaixo identifica uma solicitação de origem de bot se as seguintes condições forem atendidas:
A solicitação se origina de um dos dois endereços IP, o cabeçalho referer
começa com www.adobe.com
e o cabeçalho sec-ch-ua-mobile
identifica a solicitação como originada de um navegador de desktop.