Während die Identifizierung von Bots in einem Datensatz je nach Umgebung unterschiedlich ist, gibt es einige gängige Möglichkeiten, Bots zu erkennen.
Sie können einen Data Warehouse-Bericht mit IP-Adresse, Ansichten und Unique Visitors abrufen. Erstellen Sie dann in Excel eine Berechnung für Seitenaufrufe pro Besuch und sortieren Sie vom höchsten zum niedrigsten Wert. Bots haben in der Regel eine sehr hohe Anzahl von Seitenansichten pro Besuch (mehrere Hundert bis Tausende). Wenn Sie sich dem tatsächlichen realen Traffic nähern, werden Sie einen starken Rückgang feststellen.
Bots haben normalerweise keine verweisende URL. In der Segmentierung kann dies als Referring Domain equals Typed/Bookmarked
gefiltert werden.
Bots verwenden häufig benutzerdefinierte Benutzeragenten, die nicht in die Browser-Dimension klassifiziert sind oder als unknown
-Version eines Standard-Browsers angezeigt werden. Unbekannte Safari- und unbekannte Opera-Einträge haben eine extrem hohe Wahrscheinlichkeit, Bots zu sein.
Wir wollen das großartige Open-Source-Betriebssystem Linux nicht diskreditieren, aber anscheinend legen Bots es gerne als ihr angebliches Betriebssystem fest. Gehen Sie jedoch mit Bedacht vor, wenn Sie nicht legitimen Traffic von Linux-Benutzern ausschließen. Bots legen auch gerne gar kein Betriebssystem fest, was als Operating System ​equals Not Specified
segmentiert werden kann.
Dies gilt insbesondere für den Benutzeragenten-Bericht. Wie Sie im folgenden Screenshot sehen können, hat die „unbekannte Version“ dieser Browser fast dieselbe Anzahl von Besuchern wie Unique Visitors (und fast dieselbe Anzahl von Seitenansichten). Dies kann in der Segmentierung isoliert werden, indem ein Include-Container für Single Page Visits equals Enabled
oder Hit Depth is less than 2
erstellt wird.
Bots erhalten in der Regel bei jeder Ausführung eine neue Besucher-ID, sodass nur ein Besuch stattfindet und ihr gesamter Traffic aus einer Besuchsanzahl von 1 besteht.
Moderne Benutzer haben viel höhere Bildschirmauflösungen als in den letzten Jahren. Treffer mit den folgenden Auflösungen scheinen bei Bots sehr beliebt zu sein:
Sie könnten eine Diskrepanz zwischen dem Ursprungsland und der Zeitzone feststellen. Der Ort kann beispielsweise in den Vereinigten Staaten sein, während die Zeitzone GMT ist.
Der Benutzer meldet sich zu keinem Zeitpunkt bei seinem Besuch an und seine eVars zur Benutzeridentifizierung bleiben nicht von vorherigen Besuchen erhalten. Während einige Bots für eine Authentifizierung eingerichtet werden können, sind die meisten nicht so intelligent.
Bots fügen in der Regel keine Produkte zum Warenkorb hinzu und führen keinen Checkout durch. Meistens übermitteln sie keine Lead-Formulare oder andere Erfolgsereignisse, aber einige Bots übermitteln durchaus einfache HTML-Formulare.
Manchmal versuchen Bots, den Cache zu sprengen oder anderweitig Websites zu zerstören, indem sie auf fehlerhafte oder nicht existierende URLs zugreifen (wie typische LAMP- oder Wordpress-Admin-Seiten) oder indem sie bestimmte Abfragezeichenfolgen anhängen.
Webhosting-Services wie Amazon Web Services oder Google Cloud können als Bot-Farmen missbraucht werden. Diese IP-Adressen sind mit einem hohen Risiko verbunden, Bots zu sein:
​35.199
oder mit 35.194​