Configuración web específica para el procesamiento de registros

Última actualización: 2022-10-05
  • Creado para:
  • User
    Admin
IMPORTANTE

Más información sobre la Data Workbench Anuncio de fin de vida útil.

Información sobre la configuración específica de la web que se definen en los archivos de inclusión de conjunto de datos de procesamiento de registros que se entregan con perfiles de Adobe para el sitio.

El filtrado definido por esta configuración se produce después de que las entradas de registro abandonen los descodificadores y se aplican las transformaciones, pero antes de que la evaluación Log Entry Condition.

Filtrado de estado HTTP

Puede configurar la implementación de Site para eliminar las entradas de registro con códigos de estado sc de 400 o superior del conjunto de datos. Las solicitudes correctas tienen códigos de estado inferiores a 400. Su implementación predeterminada incluye un Log Processing Dataset Include archivo en el que está configurado el filtrado de estado HTTP.

Para editar los ajustes de configuración del filtrado de estado HTTP

  1. Abra el Profile Manager dentro del perfil del conjunto de datos y abra el Dataset\Log Processing\Traffic\HTTP Status Filter.cfg archivo.

    NOTA

    Si ha personalizado la implementación de Site, el archivo en el que existen estas opciones de configuración puede diferir de la ubicación descrita.

  2. Revise o edite los valores de los parámetros del archivo como desee. Utilice el siguiente ejemplo como guía.

    Para obtener información sobre la variable Range condición, consulte Condiciones.

  3. Guarde el HTTP Status Filter.cfg archivo haciendo clic con el botón derecho (modified) en la parte superior de la ventana y haga clic en Save.

  4. Para que los cambios realizados localmente tengan efecto, en la variable Profile Manager, haga clic con el botón derecho en la marca de verificación del archivo en la variable User y, a continuación, haga clic en Save to > <profile name>, donde nombre de perfil es el nombre del perfil del conjunto de datos o el perfil heredado al que pertenece el archivo de inclusión del conjunto de datos.

    NOTA

    No guarde el archivo de configuración modificado en ninguno de los perfiles internos proporcionados por Adobe, ya que los cambios se sobrescriben al instalar actualizaciones en estos perfiles.

Filtrado de robots

Puede configurar la implementación de Site para usar archivos de búsqueda y eliminar de su conjunto de datos las entradas de registro generadas por robots conocidos, scripts de prueba y direcciones IP para usuarios internos. Su implementación predeterminada incluye un Log Processing Dataset Include archivo en el que está configurado el filtrado de robots.

Para editar los ajustes de configuración del filtrado de robots

  1. Abra el Profile Manager dentro del perfil del conjunto de datos y abra el Dataset\Log Processing\Traffic\Robot Filter.cfg archivo.

    NOTA

    Si ha personalizado la implementación de Site, el archivo en el que existen estas opciones de configuración puede diferir de la ubicación descrita.

  2. Revise o edite los parámetros del archivo utilizando el siguiente ejemplo e información como guías:

    El archivo incluye un NotRobotCondition que se define mediante los tres parámetros siguientes:

    • Filtrado de robots sin distinción de mayúsculas y minúsculas: Verdadero o falso. Si es true, las mayúsculas y minúsculas (superior/inferior) no se tienen en cuenta en el filtrado de robots.
    • Archivo de búsqueda de robots, línea de base: Ruta y nombre de archivo del archivo de texto que contiene una lista de agentes de usuario del explorador que son robots conocidos y que se van a filtrar fuera del conjunto de datos. Adobe proporciona el archivo de búsqueda de robots de línea base. Si no especifica una ruta, el servidor de Data Workbench busca este archivo en el directorio Búsquedas del directorio de instalación del servidor de Data Workbench.
    • Archivo de búsqueda de robots, ampliado: Ruta y nombre de archivo de un archivo de texto opcional que contiene una lista de agentes de usuario del explorador o direcciones IP que definen robots específicos de su implementación. Esta lista puede incluir robots de monitorización internos, scripts de prueba y direcciones IP para usuarios internos que deben filtrarse fuera del conjunto de datos. Si no especifica una ruta, el servidor de Data Workbench busca este archivo en el directorio Búsquedas del directorio de instalación del servidor de Data Workbench.

    Si el agente de usuario del explorador de una entrada de registro no aparece en ninguno de los archivos de búsqueda, la entrada de registro se considera generada por un visitante real y no se filtra desde el conjunto de datos.

    NOTA

    La coincidencia en los archivos de búsqueda de robots utiliza subcadenas para compararlas con los campos de registro c-ip y cs(user-agent) . Si la cadena de búsqueda comienza por "$", debe coincidir con la parte frontal de la cadena que se está probando y si termina por "$", la cadena de búsqueda debe coincidir con el final de la cadena que se está probando. Si la cadena de búsqueda comienza con y termina con "$", las cadenas deben coincidir exactamente para que la entrada de registro se filtre. Por ejemplo, para probar todas las direcciones IP de un bloque de clase C, debe utilizar una cadena como $231.78.123. para forzar una coincidencia al principio de la cadena. Esto coincidiría con las direcciones 231.78.123.0 a 231.78.123.255.

  3. Guarde el archivo haciendo clic con el botón derecho (modified) en la parte superior de la ventana y haga clic en Save.

  4. Para que los cambios realizados localmente tengan efecto, en la variable Profile Manager, haga clic con el botón derecho en la marca de verificación del archivo en la variable User y, a continuación, haga clic en Save to > <profile name>, donde nombre de perfil es el nombre del perfil del conjunto de datos o el perfil heredado al que pertenece el archivo de inclusión del conjunto de datos.

    No guarde el archivo de configuración modificado en ninguno de los perfiles internos proporcionados por Adobe, ya que los cambios se sobrescriben al instalar actualizaciones en estos perfiles.

    NOTA

    Si es fundamental que las entradas de registro subyacentes utilizadas para construir un conjunto de datos no cambien (aunque cambien las transformaciones utilizadas para construir y actualizar el conjunto de datos y sus dimensiones), el archivo de búsqueda de robots, la línea de base y el archivo de búsqueda de robots, ampliado, deben estar controlados por la versión. Colocar un número de versión en estos archivos garantiza que las actualizaciones de los archivos de búsqueda de robots predeterminados no cambien de forma involuntaria los conjuntos de datos de informes creados anteriormente mediante la adición o eliminación de entradas en estos archivos.

En esta página