ログ処理に関する Web 固有の設定

Site 用プロファイルに付属のログ処理データセットインクルードファイルで定義する Web 固有の設定について取り上げます。

これらの設定によって定義されたフィルタリングは、ログエントリがデコーダーから送出されて変換が適用された後、Log Entry Condition によって評価される前に適用されます。

HTTP ステータスのフィルタリング

sc-status コードが 400 以上のログエントリは、Site の導入環境の設定によって、データセットから除外することができます。リクエストに成功した場合、そのステータスコードは 400 より小さくなります。デフォルトの実装には、HTTPステータスのフィルタリングが設定されたLog Processing Dataset Includeファイルが含まれています。

HTTP ステータスのフィルタリング設定を編集するには

  1. データセットプロファイル内でProfile Managerを開き、Dataset\Log Processing\Traffic\HTTP Status Filter.cfgファイルを開きます。

    メモ

    Siteの実装をカスタマイズした場合、これらの設定が存在するファイルが、説明した場所と異なる場合があります。

  2. このファイルのパラメーターの値を確認し、必要に応じて編集します。以下の例を参考にしてください。

    Range条件について詳しくは、条件を参照してください。

  3. ウィンドウ上部の​(modified)​を右クリックし、「Save」をクリックして、HTTP Status Filter.cfgファイルを保存します。

  4. ローカルで作成した変更を反映するには、Profile ManagerでUser列のファイルのチェックマークを右クリックし、 Save to / <profile name​をクリックします。profile nameは、データセットインクルードファイルが属するデータセットプロファイルまたは継承プロファイルの名前です。

    メモ

    アドビから提供される内部プロファイルには、変更した設定ファイルを一切保存しないでください。内部プロファイルに対するアップデートをインストールするときに変更内容が上書きされます。

ロボットのフィルタリング

Site の導入環境の設定でルックアップファイルを使用し、既知のロボットや自動テストツールによって生成されたログエントリ、さらには、内部ユーザーの IP アドレスによって生成されたログエントリをデータセットから除外することができます。デフォルトの実装には、ロボットのフィルタリングが設定されたLog Processing Dataset Includeファイルが含まれています。

ロボットのフィルタリング設定を編集するには

  1. データセットプロファイル内でProfile Managerを開き、Dataset\Log Processing\Traffic\Robot Filter.cfgファイルを開きます。

    メモ

    Siteの実装をカスタマイズした場合、これらの設定が存在するファイルが、説明した場所と異なる場合があります。

  2. ファイルのパラメーターを確認し、必要に応じて編集します。次の例を参考にしてください。

    このファイル内の NotRobotCondition には、次の 3 つのパラメーターが定義されています。

    • Case Insensitive(ロボットのフィルタリングで大文字と小文字を区別しない): true または false。true の場合、ロボットのフィルタリングでアルファベットの大文字と小文字が区別されません。
    • Robot Lookup File, Baseline:​ロボットであることが確認されており、データセットから除外すべきブラウザーユーザーエージェントをリストしたテキストファイルのパスとファイル名。基本的なロボットルックアップファイルがアドビから提供されています。パスを指定しなかった場合、Data Workbench サーバーのインストールディレクトリ内にある Lookups ディレクトリからこのファイルが検索されます。
    • Robot Lookup File, Extended:​導入環境に固有のロボット(ブラウザーユーザーエージェントまたは IP アドレス)をリストしたオプションのテキストファイルのパスとファイル名。このリストには、内部のモニタリングロボットや自動テストツールのほか、データセットから除外すべき内部ユーザーの IP アドレスを含めることができます。パスを指定しなかった場合、Data Workbench サーバーのインストールディレクトリ内にある Lookups ディレクトリからこのファイルが検索されます。

    ログエントリのブラウザーユーザーエージェントがどちらのルックアップファイルにもリストされていなかった場合、そのログエントリは、実在する訪問者によって生成されたものと見なされ、データセットから除外されません。

    メモ

    ロボットルックアップファイルでの照合では、c-ipおよびcs(user-agent)ログフィールドとの比較にサブ文字列が使用されます。 検索文字列が「$」で始まっている場合、テスト対象となる文字列の先頭部分と一致している必要があります。同様に、検索文字列が「$」で終わっている場合、テスト対象となる文字列の末尾部分と一致している必要があります。検索文字列の最初と最後の両方に「$」が存在する場合、ログエントリが除外されるためには、その検索文字列と完全に一致していることが必要です。例えば、クラス C ブロックのすべての IP アドレスがテストの対象であれば、「$231.78.123.」などの文字列を使用して、文字列の先頭部分とのマッチングを強制する必要があります。この場合、231.78.123.0 ~ 231.78.123.255 のアドレスと一致することになります。

  3. ウィンドウ上部の​(modified)​を右クリックし、「Save」をクリックして、ファイルを保存します。

  4. ローカルで作成した変更を反映するには、Profile ManagerでUser列のファイルのチェックマークを右クリックし、 Save to / <profile name​をクリックします。profile nameは、データセットインクルードファイルが属するデータセットプロファイルまたは継承プロファイルの名前です。

    アドビから提供される内部プロファイルには、変更した設定ファイルを一切保存しないでください。内部プロファイルに対するアップデートをインストールするときに変更内容が上書きされます。

    メモ

    データセットの構築に使用される基になるログエントリが変更されない(データセットとそのディメンションが変更された場合でも)ことが重要な場合は、Robot Lookup File、Baseline、Robot Lookup File、Extendedをバージョン管理する必要があります。 デフォルトのロボットルックアップファイルが更新されると、そのファイル内のエントリが追加されたり削除されたりすることで、既に構築済みのレポートデータセットが意図せず変化してしまいますが、これらのファイルにバージョン番号を設定すれば、そのようなことを確実に防ぐことができます。

このページ