Prérequis

Pour que la détection de robots fonctionne sur votre flux de données, vous devez ajouter le groupe de champs Informations sur la détection de robots à votre schéma. Consultez la documentation Schéma XDM pour savoir comment ajouter des groupes de champs à un schéma.

Configuration de la détection des robots pour les flux de données

Vous pouvez configurer la détection des robots après avoir créé une configuration de train de données. Consultez la documentation sur la création et configuration d’un flux de données, puis suivez les instructions ci-dessous pour ajouter des fonctionnalités de détection de robots à votre flux de données.

Accédez à la liste des flux de données et sélectionnez le flux de données auquel vous souhaitez ajouter la détection des robots.

Interface utilisateur des flux de données affichant la liste des flux de données.

Sur la page des détails du flux de données, sélectionnez l’option Détection de robots sur le rail de droite.

Option de détection de robots mise en surbrillance dans l’interface utilisateur des flux de données.

La page Règles de détection des robots s’affiche.

Paramètres de détection des robots dans la page Paramètres du flux de données.

Sur la page Règles de détection des robots , vous pouvez configurer la détection des robots à l’aide des fonctionnalités suivantes :

Utiliser la liste internationale d'araignées et de robots IAB/ABC

La IAB/ABC International Spiders and Bots List est une liste d’araignées et de robots Internet tierce et standard. Cette liste vous permet d’identifier le trafic automatisé, tel que les robots d’exploration des moteurs de recherche, les outils de surveillance et tout autre trafic non humain que vous ne souhaitez pas inclure dans vos comptes d’analyse.

Pour configurer votre flux de données afin d’utiliser la liste internationale d’araignées et de robots IAB/ABC :

  1. Activez l’option Utiliser la liste internationale d’araignées et de robots IAB/ABC pour la détection des robots sur ce flux de données.
  2. Sélectionnez Enregistrer pour appliquer les paramètres de détection des robots à votre flux de données.

Activation des araignées IAB et de la liste de robots.

Création de règles de détection des robots

Outre l’utilisation de la Liste internationale d’araignées et de robots IAB/ABC, vous pouvez définir vos propres règles de détection des robots pour chaque flux de données.

Vous pouvez créer des règles de détection de robots basées sur adresses IP et plages d’adresses IP.

Si vous avez besoin de règles de détection de robots plus granulaires, vous pouvez combiner les conditions IP avec les conditions d’en-tête de requête. Les règles de détection de robots peuvent utiliser les en-têtes suivants :

En-tête HTTP
Description
user-agent
En-tête qui permet aux serveurs et aux homologues réseau d’identifier l’application, le système d’exploitation, le fournisseur et/ou la version de l’agent utilisateur à l’origine de la demande.
content-type
Indique le type de média d’origine de la ressource (avant tout codage de contenu appliqué pour l’envoi).
referer
Identifie l’adresse de la page web à partir de laquelle la ressource a été demandée.
sec-ch-ua
Fournit la marque et la version significative de chaque marque associée au navigateur dans une liste séparée par des virgules.
sec-ch-ua-mobile
Indique si le navigateur se trouve sur un appareil mobile. Il peut également être utilisé par un navigateur de bureau pour indiquer une préférence pour une expérience utilisateur mobile.
sec-ch-ua-platform
Fournit la plateforme ou le système d’exploitation sur lequel l’agent utilisateur s’exécute. Par exemple : « Windows » ou « Android ».
sec-ch-ua-platform-version
Fournit la version du système d’exploitation sur lequel l’agent utilisateur s’exécute.
sec-ch-ua-arch
Fournit l’architecture CPU sous-jacente de l’agent-utilisateur, telle qu’ARM ou x86.
sec-ch-ua-model
Indique le modèle d’appareil sur lequel le navigateur s’exécute.
sec-ch-ua-bitness
Fournit le « débit » de l’architecture CPU sous-jacente de user-agent. Il s'agit de la taille en bits d'un nombre entier ou d'une adresse mémoire, typiquement 64 ou 32 bits.
sec-ch-ua-wow64
Indique si un fichier binaire de l’agent utilisateur s’exécute en mode 32 bits sous Windows 64 bits.

Pour créer une règle de détection des robots, procédez comme suit :

  1. Sélectionnez Ajouter une nouvelle règle.

    Écran des paramètres de détection des robots avec le bouton Ajouter une nouvelle règle en surbrillance.

  2. Saisissez le nom de la règle dans le champ Nom de la règle.

    Écran de règle de détection de robots avec le nom de règle en surbrillance.

  3. Sélectionnez Ajouter une nouvelle condition d’adresse IP pour ajouter une nouvelle règle basée sur l’adresse IP. Vous pouvez définir la règle par adresse IP ou par plage d’adresses IP.

    Écran de règle de détection de robots avec le champ d’adresse IP en surbrillance.

    Écran des règles de détection des robots avec le champ Plage d’adresses IP en surbrillance.

    TIP
    Les conditions IP sont basées sur une opération OR logique. Une requête est marquée comme provenant d’un robot si elle correspond à l’une des conditions IP que vous avez définies.
  4. Si vous souhaitez ajouter des conditions d’en-tête à votre règle, sélectionnez Ajouter un groupe de conditions d’en-tête, puis sélectionnez les en-têtes que la règle doit utiliser.

    Écran de règle de détection de robots avec les conditions d’en-tête mises en surbrillance.

    Ajoutez ensuite les conditions à utiliser pour l’en-tête sélectionné.

    Écran de règle de détection de robots avec les conditions d’en-tête mises en surbrillance.

  5. Après avoir configuré les règles de détection de robots souhaitées, sélectionnez Enregistrer pour appliquer les règles à votre flux de données.

    Écran de règle de détection de robots avec les conditions d’en-tête mises en surbrillance.

Exemples de règles de détection de robots

Pour vous familiariser avec la détection de robots, vous pouvez utiliser les exemples présentés ci-dessous pour créer des règles de détection de robots.

Détection de robots basée sur une adresse IP

Pour marquer toutes les requêtes provenant d’une adresse IP spécifique comme du trafic de robots, créez une règle de détection de robots qui évalue une seule adresse IP, comme illustré dans l’image ci-dessous.

Règle de détection des robots basée sur une seule adresse IP.

Détection de robots basée sur deux adresses IP

Pour marquer toutes les requêtes provenant de l’une des deux adresses IP spécifiques comme du trafic de robots, créez une règle de détection de robots qui évalue deux adresses IP, comme illustré dans l’image ci-dessous.

Règle de détection des robots basée sur deux adresses IP.

Détection de robots basée sur une plage d'adresses IP

Pour marquer toutes les requêtes provenant de n’importe quelle adresse IP dans une plage spécifique comme du trafic de robots, créez une règle de détection de robots qui évalue une plage entière d’adresses IP, comme illustré dans l’image ci-dessous.

Règle de détection des robots basée sur la plage d’adresses IP.

Détection de robots basée sur une adresse IP et un en-tête de requête

Pour marquer toutes les requêtes provenant d’une adresse IP spécifique et contenant un en-tête de requête spécifique comme du trafic de robots, créez une règle de détection de robots comme illustré dans l’image ci-dessous.

Cette règle vérifie si la requête provient d’une adresse IP spécifique et si l’en-tête de la requête referer commence par www.adobe.com.

Règle de détection des robots basée sur l’adresse IP et l’en-tête de requête.