Introducción

Como parte de este proceso requiere que forme un modelo de aprendizaje automático, en este documento se da por hecho que tiene conocimientos prácticos de uno o más entornos de aprendizaje automático.

Este ejemplo utiliza Jupyter Notebook como entorno de desarrollo. Aunque hay muchas opciones disponibles, se recomienda Jupyter Notebook porque es una aplicación web de código abierto con requisitos de cálculo bajos. Se puede descargar del sitio oficial.

Use Query Service para definir un umbral para la actividad de bots

Los dos atributos utilizados para extraer datos para la detección de bots son:

  • ID de visitante de Experience Cloud (ECID, también conocido como MCID): Proporciona un ID universal y persistente que identifica a los visitantes en todas las soluciones de Adobe.
  • Marca de tiempo: Proporciona la hora y la fecha en formato UTC en que se produjo una actividad en el sitio web.
NOTA
El uso de mcid todavía se encuentra en las referencias de área de nombres al ID de visitante de Experience Cloud, como se ve en el ejemplo siguiente.

La siguiente instrucción SQL proporciona un ejemplo inicial para identificar la actividad de bots. La instrucción supone que si un visitante hace 50 clics en un minuto, el usuario es un bot.

SELECT *
FROM   <YOUR_TABLE_NAME>
WHERE  enduserids._experience.mcid NOT IN (SELECT enduserids._experience.mcid
                                           FROM   <YOUR_TABLE_NAME>
                                           GROUP  BY Unix_timestamp(timestamp) /
                                                     60,
                                                     enduserids._experience.mcid
                                           HAVING Count(*) > 50);

La expresión filtra los ECID (mcid) de todos los visitantes que alcanzan el umbral, pero no aborda los picos de tráfico de otros intervalos.