Introdução

Como parte desse processo requer que você treine um modelo de aprendizado de máquina, este documento presume um conhecimento prático de um ou mais ambientes de aprendizado de máquina.

Este exemplo usa Jupyter Notebook como um ambiente de desenvolvimento. Embora existam muitas opções disponíveis, Jupyter Notebook é recomendado porque é um aplicativo web de código aberto que tem poucos requisitos computacionais. Ele pode ser baixado do site oficial.

Usar Query Service para definir um limite para a atividade de bot

Os dois atributos usados para extrair dados para detecção de bot são:

  • ID de visitante do Experience Cloud (ECID, também conhecida como MCID): fornece uma ID contínua e universal que identifica os visitantes em todas as soluções da Adobe.
  • Carimbo de data e hora: fornece a hora e a data em formato UTC quando uma atividade ocorreu no site.
NOTE
O uso de mcid ainda é encontrado nas referências de namespace à ID de visitante do Experience Cloud, como visto no exemplo abaixo.

A instrução SQL a seguir fornece um exemplo inicial para identificar a atividade de bot. A instrução pressupõe que, se um visitante realizar 50 cliques em um minuto, o usuário será um bot.

SELECT *
FROM   <YOUR_TABLE_NAME>
WHERE  enduserids._experience.mcid NOT IN (SELECT enduserids._experience.mcid
                                           FROM   <YOUR_TABLE_NAME>
                                           GROUP  BY Unix_timestamp(timestamp) /
                                                     60,
                                                     enduserids._experience.mcid
                                           HAVING Count(*) > 50);

A expressão filtra os ECIDs (mcid) de todos os visitantes que atingem o limite, mas não aborda picos no tráfego de outros intervalos.