LLM および AI 生成トラフィックのレポート
このユースケースでは、Customer Journey Analyticsの派生フィールド機能を基盤として使用して、LLM (大規模言語モデル)とAI生成トラフィックについてレポートする方法を解説します。
検出方法
LLMおよびAI生成トラフィックを検出するには、次の点を区別します。
- LLM web クローラー:トレーニングと検索用のデータを収集する拡張生成(RAG)。
- AI エージェント:人間に代わってタスクを実行するインターフェイスとして機能します。 AI エージェントは、web分析のトラッキング方法を回避するAPIを介したやり取りを好みます。 それでも、AIが生成したトラフィックの大部分は、web サイトを通じて分析することができます。
LLMとAI生成のトラフィックを識別および監視するための3つの一般的なコア検出方法は次のとおりです。
- ユーザーエージェント ID: サーバーにリクエストが行われると、HTTP User-Agent ヘッダーが抽出され、既知のAI web クローラーとエージェントパターンに対して分析されます。 このサーバーサイドのメソッドは、HTTP ヘッダーへのアクセスを必要とし、データ収集レイヤーで実装される場合に最も効果的です。
- リファラー分類: HTTP リファラーヘッダーには、現在のリクエストにリンクされている以前のweb ページのURLが含まれています。 このヘッダーは、オーディエンスがChatGPTやPerplexityなどのweb インターフェイスからサイトにクリックしたタイミングを明らかにします。
- クエリパラメーター検出: AI サービスは、URL パラメーター(特にUTM パラメーター)をリンクに追加できます。 これらのパラメーターはURLに保持され、標準的な分析実装を通じて検出できるため、クライアントサイドのトラッキングシナリオでも、これらのURL パラメーターを重要な指標として使用できます。
次の表に、さまざまなLLMおよびAI インタラクションシナリオに対して検出方法を使用する方法を示します。
GPTBot、ClaudeBotなど)は、サーバーサイドのロギングが実装されている場合に識別できます。ChatGPT-User, claude-web)は、サーバーサイドのログでヘッダーをキャプチャするときに識別できます。OAI-SearchBot, PerplexityBot)は、サーバーサイドのログで識別できます。課題
LLMとAI エージェントは、デジタルプロパティを利用する際に、複雑で進化する行動を示します。 これらのテクノロジーは、プラットフォームやバージョン間で一貫性がなく動作します。 こうした一貫性の欠如は、データ担当者にとって特有の課題をもたらします。 行動パターンは大きく異なり、使用される特定のAI プラットフォーム、バージョン、インタラクションモードによって異なります。 この運用上の多様性により、標準的な分析フレームワーク内で、LLMとAI生成トラフィックを追跡および分類する取り組みが複雑化します。 これらのインタラクションの複雑な性質と急速な進化を組み合わせることで、データの整合性を維持するための詳細な検出および分類方法が必要になります。
- 部分的なデータ収集:一部の新しいAI エージェントは、限定的なJavaScriptを実行するため、クライアントサイド実装のAnalytics データが不完全になります。 その結果、一部のインタラクションは追跡されますが、他のインタラクションは見逃されます。
- 一貫性のないセッションデータ:AI エージェントがJavaScriptを実行する場合、セッションまたはページタイプによって異なる場合があります。 この違いにより、クライアントサイドの実装のために、Customer Journey Analyticsで断片化されたユーザージャーニーが作成されます。
- 検出の課題:部分的なトラッキングでは、特定のタッチポイントがAnalyticsに表示されない可能性があるため、検出が信頼性を失います。
署名の検出
2025年8月現在、以下の具体的なシグナルを検出方法ごとに特定できます。
ユーザーエージェントの識別
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; GPTBot/1.1; +https://openai.com/gptbotMozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; ChatGPT-User/1.0; +https://openai.com/botMozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; ChatGPT-User/2.0; +https://openai.com/botMozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; OAI-SearchBot/1.0; +https://openai.com/searchbotMozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; ClaudeBot/1.0; +claudebot@anthropic.comMozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Claude-User/1.0; +Claude-User@anthropic.com)Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Claude-SearchBot/1.0; +Claude-SearchBot@anthropic.com)Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; PerplexityBot/1.0; +https://perplexity.ai/perplexitybot)Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Perplexity-User/1.0; +https://www.perplexity.ai/useragent)Mozilla/5.0 (compatible; Google-Extended/1.0; +http://www.google.com/bot.html)Mozilla/5.0 (compatible; BingBot/1.0; +http://www.bing.com/bot.html)Mozilla/5.0 (compatible; DuckAssistBot/1.0; +http://www.duckduckgo.com/bot.html)Mozilla/5.0 (compatible; YouBot (+http://www.you.com))Mozilla/5.0 (compatible; meta-externalagent/1.1 (+https://developers.facebook.com/docs/sharing/webmasters/crawler))Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/600.2.5 (KHTML, like Gecko) Version/8.0.2 Safari/600.2.5 (Amazonbot/0.1; +https://developer.amazon.com/support/amazonbot)Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_5) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.1.1 Safari/605.1.15 (Applebot/0.1; +http://www.apple.com/go/applebot)Mozilla/5.0 (compatible; Applebot-Extended/1.0; +http://www.apple.com/bot.html)Mozilla/5.0 (compatible; Bytespider/1.0; +http://www.bytedance.com/bot.html)Mozilla/5.0 (compatible; MistralAI-User/1.0; +https://mistral.ai/bot)Mozilla/5.0 (compatible; cohere-ai/1.0; +http://www.cohere.ai/bot.html)リファラー分類
クエリパラメータ検出
実装
派生フィールド 、 セグメント 、 ワークスペースプロジェクト の具体的な設定と設定により、一般的なCustomer Journey Analytics設定(connection、 データビュー、および ワークスペースプロジェクト )内のLLMとAI生成トラフィックについてレポートできます。
派生フィールド
検出方法と検出信号を設定するには、派生フィールドを基盤として使用します。 例えば、 ユーザーエージェント ID、 クエリパラメーター検出、 リファラー分類の派生フィールドを定義します。
LLM/AI ユーザーエージェントの識別
Case When派生フィールド関数を使用して、LLM/AI ユーザーエージェントを識別する派生フィールドを定義します。
LLM/AI クエリパラメーター検出
URL解析および分類派生フィールド関数を使用して、クエリパラメーターを検出する派生フィールドを定義します。
LLM/AI リファラー分類
URL解析および分類派生フィールド関数を使用して、リファラーを分類する派生フィールドを定義します。
セグメント
専用セグメントを設定して、LLMとAIが生成したトラフィックに関連するイベント、セッション、人物を特定するのに役立ちます。 例えば、先ほど作成した派生フィールドを使用して、LLMとAIが生成したトラフィックを識別するセグメントを定義します。
Workspace プロジェクト
派生フィールドとセグメントを使用して、LLMとAIが生成したトラフィックをレポートし、分析します。 例えば、以下の注釈付きプロジェクトを参照してください。