Introduzione
Poiché parte di questo processo richiede la formazione di un modello di apprendimento automatico, il presente documento presuppone una conoscenza operativa di uno o più ambienti di apprendimento automatico.
In questo esempio viene utilizzato Jupyter Notebook come ambiente di sviluppo. Sebbene siano disponibili molte opzioni, Jupyter Notebook è consigliato in quanto si tratta di un'applicazione Web open-source con requisiti di calcolo ridotti. Può essere scaricato dal sito ufficiale.
Usa Query Service per definire una soglia per l'attività bot
I due attributi utilizzati per estrarre i dati per il rilevamento di bot sono:
- ID visitatore Experience Cloud (ECID, noto anche come MCID): fornisce un ID universale e costante che identifica i visitatori in tutte le soluzioni Adobi.
- Timestamp: fornisce l’ora e la data in formato UTC in cui si è verificata un’attività sul sito web.
mcid
è ancora presente nei riferimenti spazio dei nomi all'ID visitatore Experience Cloud, come illustrato nell'esempio seguente.L’istruzione SQL seguente fornisce un esempio iniziale per identificare l’attività bot. L’istruzione presuppone che, se un visitatore esegue 50 clic in un minuto, l’utente sia un bot.
SELECT *
FROM <YOUR_TABLE_NAME>
WHERE enduserids._experience.mcid NOT IN (SELECT enduserids._experience.mcid
FROM <YOUR_TABLE_NAME>
GROUP BY Unix_timestamp(timestamp) /
60,
enduserids._experience.mcid
HAVING Count(*) > 50);
L'espressione filtra gli ECID (mcid
) di tutti i visitatori che soddisfano la soglia ma non risolve i picchi di traffico da altri intervalli.