Configurare il rilevamento di bot per gli stream di dati

Il traffico proveniente da entità non umane, come programmi automatizzati, web scraper, ragni, scanner scriptati, può rendere più difficile identificare gli eventi che si verificano dai visitatori umani. Questo tipo di traffico può influenzare negativamente importanti metriche aziendali, portando a rapporti di traffico errati.

Il rilevamento dei bot consente di identificare gli eventi generati dai SDK per web, SDK per dispositivi mobili e Server API come generate da spider e bot noti.

Configurando il rilevamento di bot per gli stream di dati, puoi identificare indirizzi IP, intervalli IP e intestazioni di richiesta specifici che desideri classificare come eventi bot.

L’identificazione del traffico da bot può fornire una misurazione più accurata dell’attività degli utenti sul sito o sull’app mobile.

Quando una richiesta all’Edge Network corrisponde a una qualsiasi delle regole di rilevamento di bot, lo schema XDM viene aggiornato con un punteggio bot (sempre impostato su 1), come mostrato di seguito.

{
  "botDetection": {
    "score": 1
  }
}

Questo punteggio bot consente alle soluzioni che ricevono la richiesta di identificare correttamente il traffico da bot.

IMPORTANT
Il rilevamento dei bot non elimina alcuna richiesta di bot. Aggiorna lo schema XDM solo con il punteggio bot e inoltra l’evento al servizio flusso di dati configurato.
Le soluzioni di Adobe possono gestire il punteggio bot in diversi modi. Ad esempio, Adobe Analytics utilizza i propri servizio di filtro bot e non utilizza il punteggio impostato dall’Edge Network. I due servizi utilizzano lo stesso Elenco bot IAB, quindi il punteggio bot è identico.

Dopo la creazione, le regole di rilevamento dei bot possono richiedere fino a 15 minuti per propagarsi nell’Edge Network.

Prerequisiti prerequisites

Affinché il rilevamento di bot funzioni sullo stream di dati, devi aggiungere Informazioni sul rilevamento bot gruppo di campi allo schema. Consulta la Schema XDM documentazione per scoprire come aggiungere gruppi di campi a uno schema.

Configurare il rilevamento di bot per gli stream di dati configure

Puoi configurare il rilevamento di bot dopo aver creato una configurazione dello stream di dati. Consulta la documentazione su come creare e configurare uno stream di dati, quindi segui le istruzioni riportate di seguito per aggiungere funzionalità di rilevamento bot allo stream di dati.

Vai all’elenco dei flussi di dati e seleziona il flusso di dati a cui desideri aggiungere il rilevamento di bot.

Interfaccia utente per i flussi di dati che mostra l’elenco dei flussi di dati.

Nella pagina dei dettagli dello stream di dati, seleziona la scheda Rilevamento bot nella barra a destra.

L’opzione di rilevamento bot è evidenziata nell’interfaccia utente dei flussi di dati.

Il Regole di rilevamento bot viene visualizzata.

Impostazioni di rilevamento bot nella pagina delle impostazioni dello stream di dati.

Dalla pagina Regole di rilevamento bot, puoi configurare il rilevamento bot utilizzando le seguenti funzionalità:

Utilizzare l'elenco internazionale Spiders e bot IAB/ABC iab-list

Il Elenco internazionale Spider e bot IAB/ABC è un elenco di terze parti standard di settore di spider e bot internet che consente di identificare il traffico automatizzato, ad esempio i crawler dei motori di ricerca, gli strumenti di monitoraggio e altro traffico non umano che potresti non voler visualizzare nei conteggi di analytics.

Per configurare lo stream di dati per utilizzare IAB/ABC International Spiders and Bots List, attiva/disattiva Utilizza l’elenco internazionale Spiders e Bots IAB/ABC per il rilevamento di bot in questo flusso di dati , quindi seleziona Salva per applicare le impostazioni di rilevamento bot allo stream di dati.

Spider IAB ed elenco di bot abilitati.

Creare regole di rilevamento bot rules

Oltre a utilizzare il Elenco internazionale Spider e bot IAB/ABC, puoi definire le tue regole di rilevamento bot per ogni flusso di dati.

Puoi creare regole di rilevamento bot basate su Indirizzi IP e Intervalli di indirizzi IP.

Se hai bisogno di regole di rilevamento bot più granulari, puoi combinare le condizioni IP con le condizioni dell’intestazione della richiesta. Le regole di rilevamento dei bot possono utilizzare le intestazioni seguenti:

Intestazione HTTP
Descrizione
user-agent
Intestazione che consente ai server e ai peer di rete di identificare l'applicazione, il sistema operativo, il fornitore e/o la versione dell'agente utente richiedente.
content-type
Indica il tipo di file multimediale originale della risorsa (prima di qualsiasi codifica di contenuto applicata per l’invio).
referer
Identifica l’indirizzo della pagina web da cui è stata richiesta la risorsa.
sec-ch-ua
Fornisce il brand e la versione significativa per ogni brand associato al browser in un elenco separato da virgole.
sec-ch-ua-mobile
Indica se il browser si trova su un dispositivo mobile. Può essere utilizzato anche da un browser desktop per indicare una preferenza per un’esperienza di utilizzo mobile.
sec-ch-ua-platform
Fornisce la piattaforma o il sistema operativo su cui è in esecuzione l'agente utente. Ad esempio: "Windows" o "Android".
sec-ch-ua-platform-version
Fornisce la versione del sistema operativo in cui è in esecuzione l'agente utente.
sec-ch-ua-arch
Fornisce l'architettura CPU sottostante dell'agente utente, ad esempio ARM o x86.
sec-ch-ua-model
Indica il modello di dispositivo su cui è in esecuzione il browser.
sec-ch-ua-bitness
Fornisce il "bit" dell’architettura CPU sottostante dell’agente utente. Dimensione in bit di un numero intero o di un indirizzo di memoria, in genere 64 o 32 bit.
sec-ch-ua-wow64
Indica se un file binario dell'agente utente è in esecuzione in modalità a 32 bit in Windows a 64 bit.

Per creare una regola di rilevamento bot, effettua le seguenti operazioni:

  1. Seleziona Aggiungi nuova regola.

    Schermata delle impostazioni di rilevamento bot, con il pulsante Aggiungi nuova regola evidenziato.

  2. Digita un nome per la regola nella Nome regola campo.

    Schermata delle regole di rilevamento bot con il nome della regola evidenziato.

  3. Seleziona Aggiungi nuova condizione IP per aggiungere una nuova regola basata su IP. È possibile definire la regola in base all’indirizzo IP o all’intervallo di indirizzi IP.

    Schermata delle regole di rilevamento bot con il campo dell’indirizzo IP evidenziato.

    Schermata delle regole di rilevamento bot con il campo dell’intervallo IP evidenziato.

    note tip
    TIP
    Le condizioni IP si basano su un OR operazione. Una richiesta è contrassegnata come proveniente da un bot se corrisponde a una qualsiasi delle condizioni IP definite.
  4. Se desideri aggiungere condizioni di intestazione alla regola, seleziona Aggiungi gruppo di condizioni intestazione, quindi seleziona le intestazioni che desideri utilizzare per la regola.

    Schermata delle regole di rilevamento bot con le condizioni di intestazione evidenziate.

    Quindi, aggiungi le condizioni da utilizzare per l’intestazione selezionata.

    Schermata delle regole di rilevamento bot con le condizioni di intestazione evidenziate.

  5. Dopo aver configurato le regole di rilevamento bot desiderate, seleziona Salva per applicare le regole allo stream di dati.

    Schermata delle regole di rilevamento bot con le condizioni di intestazione evidenziate.

Esempi di regole di rilevamento bot examples

Per aiutarti a iniziare a rilevare i bot, puoi utilizzare gli esempi dettagliati di seguito per creare le regole di rilevamento dei bot.

Rilevamento bot basato su un indirizzo IP one-ip

Per contrassegnare tutte le richieste provenienti da un indirizzo IP specifico come traffico da bot, crea una nuova regola di rilevamento bot che valuti un singolo indirizzo IP, come illustrato nell’immagine seguente.

Regola di rilevamento bot basata su un indirizzo IP.

Rilevamento dei bot basato su due indirizzi IP two-ip

Per contrassegnare tutte le richieste provenienti da uno di due indirizzi IP specifici come traffico da bot, crea una nuova regola di rilevamento bot che valuta due indirizzi IP, come illustrato nell’immagine seguente.

Regola di rilevamento dei bot basata su due indirizzi IP.

Rilevamento di bot basato su un intervallo di indirizzi IP range

Per contrassegnare tutte le richieste provenienti da qualsiasi indirizzo IP in un intervallo specifico come traffico da bot, crea una nuova regola di rilevamento bot che valuti un intero intervallo di indirizzi IP, come illustrato nell’immagine seguente.

Regola di rilevamento dei bot basata sull’intervallo IP.

Rilevamento di bot basato su un indirizzo IP e un’intestazione di richiesta ip-header

Per contrassegnare come traffico bot tutte le richieste provenienti da un indirizzo IP specifico e contenenti un’intestazione di richiesta specifica, crea una nuova regola di rilevamento bot, come illustrato nell’immagine seguente.

Questa regola controlla se la richiesta proviene da un indirizzo IP specifico e se referer l’intestazione della richiesta inizia con www.adobe.com.

Regola di rilevamento dei bot basata sull’indirizzo IP e sull’intestazione della richiesta.

Rilevamento dei bot in base a più condizioni multiple-conditions

Puoi creare regole di rilevamento bot in base a:

  • Più condizioni diverse: condizioni diverse vengono valutate come logiche AND operazione, ossia che le condizioni devono essere soddisfatte simultaneamente affinché la richiesta possa essere identificata come proveniente da un bot.
  • Più condizioni dello stesso tipo: le condizioni dello stesso tipo vengono valutate come logiche OR operazione: se una delle condizioni è soddisfatta, la richiesta viene identificata come proveniente da un bot.

La regola mostrata nell’immagine seguente identifica una richiesta di origine da bot se sono soddisfatte le seguenti condizioni:

La richiesta proviene da uno dei due indirizzi IP, il referer l’intestazione inizia con www.adobe.come sec-ch-ua-mobile l’intestazione identifica la richiesta come proveniente da un browser desktop.

Regola di rilevamento dei bot basata su più condizioni.

recommendation-more-help
c4bd45d4-a044-4e32-94ad-5e2f71800fac