一般的なボット署名

データセット内のボットの識別は環境によって異なりますが、次に、ボットを識別する一般的な方法を示します。

1回の訪問あたりの高いページ表示数

IPアドレス、ページ表示、個別訪問者を含むData Warehouseレポートを取り込むことができます。 次に、Excel​で1回​の訪問あたりのページ表示数の計算を作成し、高い順に並べ替えます。 ボットのページ表示数は、通常、1回の訪問あたり非常に多く(数10 ~数千)になります。 実際のトラフィックに移動すると、大幅に減少します。

転送者なし

ボットは通常、参照URLを持ちません。 セグメント化では、これはとしてフィルタでき Referring Domain equals Typed/Bookmarkedます。

不正なユーザーエージェント

ボットは、多くの場合、Browsersディメンションに分類されていない、または標準ブラウザーの unknown バージョンとして表示されるカスタムユーザーエージェントを使用します。 未知のSafariや未知のオペラは、ボットである可能性が非常に高い。

Linuxまたは「指定なし」のオペレーティングシステム

ぼくたちは、オープンソースのLinuxオペレーティングシステムを信用しないつもりはないけれど、でも、どうやら、それをオペレーティングシステムとして設定するのがボットみたいだ。 ただし、Linuxユーザから正規のトラフィックを除外する場合は注意が必要です。 ボットは、オペレーティングシステムを設定しないことを好みます。オペレーティングシステムは、としてセグメント化でき Operating System ​equals Not Specifiedます。

ページ表示=訪問回数=個別訪問者数

これは、特にユーザーエージェントレポートに適用されます。 下のスクリーンショットに示すように、これらのブラウザーの「不明なバージョン」の訪問者数は、実訪問者数とほぼ同じです(ページ表示数もほぼ同じです)。 これは、またはの「 含める 」 Single Page Visits equals Enabled コンテナを作成することで、セグメント化で分離でき Hit Depth is less than 2ます。

訪問回数1

ボットは通常、実行のたびに新しい訪問者IDを取得するので、訪問は1回のみ発生し、すべてのトラフィックは訪問回数1で構成されます。

画面の解像度を下げる

現代のユーザーは、以前に比べて解像度がはるかに高くなっています。 次の解像度を持つヒットは、ボットにとって非常に人気があるようです。

  • 1024x768​​
  • 1366 x 768
  • 1600 x 864
  • 800 x 600
  • 1600 x 1200
  • 指定なし
  • 1024 x 667

国とタイムゾーンの不一致

発信元の国とタイムゾーンが一致しないことに気づくでしょう。 例えば、場所は米国ですが、タイムゾーンはGMTである場合があります。

ログインしていません

ユーザーが訪問のどの時点でもログインせず、ユーザーID eVarが以前の訪問と異なります。 一部のボットは認証用に設定できますが、大部分のボットはスマートではありません。

訪問中のKPIはありません

ボットは通常、買い物かごに商品を追加したりチェックアウトしたりしません。 ほとんどの場合、リードフォームや他の成功イベントを送信していませんが、ボットによっては単純なHTMLフォームを送信している場合があります。​

特定のクエリ文字列が存在する

ボットがキャッシュを破棄しようとしたり、存在しない形式のURLやURL(一般的なLAMPやWordpressの管理ページなど)をヒットしたり、特定のクエリ文字列を追加したりしてサイトを壊そうとする場合があります。

分散コンピューティングプラットフォームから派生するIPアドレス

AmazonWebサービスやGoogle CloudなどのWebホスティングサービスは、ボットファームとして悪用される場合があります。 これらのIPアドレスは、ボットになるリスクが高くなります。​

  • Google Cloud:またはのIPアドレス開始 ​35.199 35.194​

このページ