Configurare il rilevamento di bot per gli stream di dati
Il traffico non umano proveniente da programmi automatizzati, web scraper, spider e scanner scriptati può rendere difficile identificare gli eventi provenienti dai visitatori umani. Questo tipo di traffico può influenzare negativamente importanti metriche aziendali, portando a rapporti di traffico errati.
Il rilevamento dei bot consente di identificare gli eventi generati da Web SDK, Mobile SDK e Server API come generati da spider e bot noti.
Configurando il rilevamento di bot per gli stream di dati, puoi identificare indirizzi IP, intervalli IP e intestazioni di richiesta specifici da classificare come eventi bot. Questo consente di fornire una misurazione più accurata dell’attività dell’utente sul sito o sull’app mobile.
Quando una richiesta all’Edge Network corrisponde a una qualsiasi delle regole di rilevamento di bot, lo schema XDM viene aggiornato con un punteggio bot (sempre impostato su 1), come illustrato di seguito:
{
"botDetection": {
"score": 1
}
}
Questo punteggio bot consente alle soluzioni che ricevono la richiesta di identificare correttamente il traffico da bot.
Dopo la creazione, le regole di rilevamento dei bot possono richiedere fino a 15 minuti per propagarsi nell’Edge Network.
Prerequisiti prerequisites
Affinché il rilevamento bot funzioni sullo stream di dati, devi aggiungere il gruppo di campi Informazioni sul rilevamento bot allo schema. Per informazioni su come aggiungere gruppi di campi a uno schema, consulta la documentazione dello schema XDM.
Configurare il rilevamento di bot per gli stream di dati configure
Puoi configurare il rilevamento di bot dopo aver creato una configurazione dello stream di dati. Consulta la documentazione su come creare e configurare uno stream di dati, quindi segui le istruzioni riportate di seguito per aggiungere funzionalità di rilevamento bot allo stream di dati.
Vai all’elenco dei flussi di dati e seleziona il flusso di dati a cui desideri aggiungere il rilevamento di bot.
Nella pagina dei dettagli dello stream di dati, seleziona l'opzione Rilevamento bot nella barra a destra.
Viene visualizzata la pagina Regole di rilevamento bot.
Dalla pagina Regole di rilevamento bot, puoi configurare il rilevamento bot utilizzando le seguenti funzionalità:
- Utilizzo di [IAB/ABC International Spiders and Bots List].
- Creazione di regole di rilevamento bot personalizzate.
Utilizzare l'elenco internazionale Spiders e bot IAB/ABC iab-list
L'IAB/ABC International Spiders and Bots List è un elenco standard di terze parti di spider e bot Internet. Questo elenco ti aiuta a identificare il traffico automatizzato, ad esempio i crawler dei motori di ricerca, gli strumenti di monitoraggio e altro traffico non umano che potresti non voler includere nei conteggi di analisi.
Per configurare lo stream di dati per l’utilizzo dell’elenco internazionale Spiders e Bots IAB/ABC:
- Attiva l'opzione Usa elenco Spider e bot internazionali IAB/ABC per il rilevamento di bot in questo flusso di dati.
- Seleziona Salva per applicare le impostazioni di rilevamento bot allo stream di dati.
Creare regole di rilevamento bot rules
Oltre a utilizzare l'elenco internazionale Spider e bot IAB/ABC, puoi definire le tue regole di rilevamento bot per ogni flusso di dati.
Puoi creare regole di rilevamento bot in base a indirizzi IP e intervalli di indirizzi IP.
Se hai bisogno di regole di rilevamento bot più granulari, puoi combinare le condizioni IP con le condizioni dell’intestazione della richiesta. Le regole di rilevamento dei bot possono utilizzare le intestazioni seguenti:
user-agent
content-type
referer
sec-ch-ua
sec-ch-ua-mobile
sec-ch-ua-platform
sec-ch-ua-platform-version
sec-ch-ua-arch
sec-ch-ua-model
sec-ch-ua-bitness
sec-ch-ua-wow64
Per creare una regola di rilevamento bot, effettua le seguenti operazioni:
-
Seleziona Aggiungi nuova regola.
-
Digitare un nome per la regola nel campo Nome regola.
-
Selezionare Aggiungi nuova condizione IP per aggiungere una nuova regola basata su IP. È possibile definire la regola in base all’indirizzo IP o all’intervallo di indirizzi IP.
note tip TIP Le condizioni IP si basano su un'operazione logica OR
. Una richiesta è contrassegnata come proveniente da un bot se corrisponde a una qualsiasi delle condizioni IP definite. -
Se si desidera aggiungere condizioni di intestazione alla regola, selezionare Aggiungi gruppo di condizioni di intestazione, quindi selezionare le intestazioni da utilizzare per la regola.
Quindi, aggiungi le condizioni da utilizzare per l’intestazione selezionata.
-
Dopo aver configurato le regole di rilevamento bot desiderate, seleziona Salva per applicare le regole allo stream di dati.
Esempi di regole di rilevamento bot examples
Per aiutarti a iniziare a rilevare i bot, puoi utilizzare gli esempi dettagliati di seguito per creare le regole di rilevamento dei bot.
Rilevamento bot basato su un indirizzo IP one-ip
Per contrassegnare tutte le richieste provenienti da un indirizzo IP specifico come traffico da bot, crea una nuova regola di rilevamento bot che valuti un singolo indirizzo IP, come illustrato nell’immagine seguente.
Rilevamento dei bot basato su due indirizzi IP two-ip
Per contrassegnare tutte le richieste provenienti da uno di due indirizzi IP specifici come traffico da bot, crea una nuova regola di rilevamento bot che valuta due indirizzi IP, come illustrato nell’immagine seguente.
Rilevamento di bot basato su un intervallo di indirizzi IP range
Per contrassegnare tutte le richieste provenienti da qualsiasi indirizzo IP in un intervallo specifico come traffico da bot, crea una nuova regola di rilevamento bot che valuti un intero intervallo di indirizzi IP, come illustrato nell’immagine seguente.
Rilevamento di bot basato su un indirizzo IP e un’intestazione di richiesta ip-header
Per contrassegnare come traffico bot tutte le richieste provenienti da un indirizzo IP specifico e contenenti un’intestazione di richiesta specifica, crea una nuova regola di rilevamento bot, come illustrato nell’immagine seguente.
Questa regola controlla se la richiesta proviene da un indirizzo IP specifico e se l'intestazione della richiesta referer
inizia con www.adobe.com
.
Rilevamento dei bot in base a più condizioni multiple-conditions
Puoi creare regole di rilevamento bot in base a:
- Condizioni diverse multiple: condizioni diverse vengono valutate come un'operazione logica
AND
, il che significa che le condizioni devono essere soddisfatte simultaneamente affinché la richiesta possa essere identificata come proveniente da un bot. - Condizioni multiple dello stesso tipo: le condizioni dello stesso tipo vengono valutate come un'operazione
OR
logica, il che significa che se una qualsiasi delle condizioni viene soddisfatta, la richiesta viene identificata come proveniente da un bot.
La regola mostrata nell’immagine seguente identifica una richiesta di origine da bot se sono soddisfatte le seguenti condizioni:
La richiesta proviene da uno dei due indirizzi IP, l'intestazione referer
inizia con www.adobe.com
e l'intestazione sec-ch-ua-mobile
identifica la richiesta come proveniente da un browser desktop.