Configuración web específica para el procesamiento de registros

Información sobre la configuración específica de la web que se definen en los archivos de inclusión de conjunto de datos de procesamiento de registros que se entregan con perfiles de Adobe para el sitio.

El filtrado definido por esta configuración se produce después de que las entradas de registro abandonen los descodificadores y se aplican las transformaciones, pero antes de la evaluación por parte de Log Entry Condition.

Filtrado de estado HTTP

Puede configurar la implementación de Site para eliminar las entradas de registro con códigos de estado sc de 400 o superior del conjunto de datos. Las solicitudes correctas tienen códigos de estado inferiores a 400. La implementación predeterminada incluye un archivo Log Processing Dataset Include en el que se ha configurado el filtrado de estado HTTP.

Para editar los ajustes de configuración del filtrado de estado HTTP

  1. Abra Profile Manager en el perfil del conjunto de datos y abra el archivo Dataset\Log Processing\Traffic\HTTP Status Filter.cfg .

    NOTA

    Si ha personalizado la implementación de Site, el archivo en el que existen estos ajustes de configuración puede diferir de la ubicación descrita.

  2. Revise o edite los valores de los parámetros del archivo como desee. Utilice el siguiente ejemplo como guía.

    Para obtener información sobre la condición Range, consulte Condiciones.

  3. Guarde el archivo HTTP Status Filter.cfg haciendo clic con el botón derecho en (modified) en la parte superior de la ventana y haciendo clic en Save.

  4. Para que los cambios realizados localmente surtan efecto, en Profile Manager, haga clic con el botón derecho en la marca de verificación del archivo en la columna User y, a continuación, haga clic en Save to > <profile name>, donde el nombre del perfil es el nombre del perfil del conjunto de datos o del perfil heredado al que pertenece el archivo de inclusión del conjunto de datos.

    NOTA

    No guarde el archivo de configuración modificado en ninguno de los perfiles internos proporcionados por Adobe, ya que los cambios se sobrescriben al instalar actualizaciones en estos perfiles.

Filtrado de robots

Puede configurar la implementación de Site para que utilice archivos de búsqueda y elimine las entradas de registro generadas por robots conocidos, scripts de prueba y direcciones IP para usuarios internos del conjunto de datos. La implementación predeterminada incluye un archivo Log Processing Dataset Include en el que se ha configurado el filtrado de robots.

Para editar los ajustes de configuración del filtrado de robots

  1. Abra Profile Manager en el perfil del conjunto de datos y abra el archivo Dataset\Log Processing\Traffic\Robot Filter.cfg .

    NOTA

    Si ha personalizado la implementación de Site, el archivo en el que existen estos ajustes de configuración puede diferir de la ubicación descrita.

  2. Revise o edite los parámetros del archivo utilizando el siguiente ejemplo e información como guías:

    El archivo incluye un NotRobotCondition definido por los tres parámetros siguientes:

    • Filtrado de robots sin distinción de mayúsculas y minúsculas: True o false. Si es true, las mayúsculas y minúsculas (superior/inferior) no se tienen en cuenta en el filtrado de robots.
    • Archivo de búsqueda de robots, línea de base: la ruta y el nombre de archivo del archivo de texto que contiene una lista de agentes de usuario del explorador que son robots conocidos y que se van a filtrar fuera del conjunto de datos. Adobe proporciona el archivo de búsqueda de robots de línea base. Si no especifica una ruta, el servidor de Data Workbench busca este archivo en el directorio Búsquedas del directorio de instalación del servidor de Data Workbench.
    • Archivo de búsqueda de robots, ampliado: la ruta y el nombre de archivo de un archivo de texto opcional que contiene una lista de agentes de usuario del explorador o direcciones IP que definen robots específicos de su implementación. Esta lista puede incluir robots de monitorización internos, scripts de prueba y direcciones IP para usuarios internos que deben filtrarse fuera del conjunto de datos. Si no especifica una ruta, el servidor de Data Workbench busca este archivo en el directorio Búsquedas del directorio de instalación del servidor de Data Workbench.

    Si el agente de usuario del explorador de una entrada de registro no aparece en ninguno de los archivos de búsqueda, la entrada de registro se considera generada por un visitante real y no se filtra desde el conjunto de datos.

    NOTA

    La coincidencia en los archivos de búsqueda de robots utiliza subcadenas para compararlas con los campos de registro c-ip y cs(user-agent) . Si la cadena de búsqueda comienza por "$", debe coincidir con la parte frontal de la cadena que se está probando y si termina por "$", la cadena de búsqueda debe coincidir con el final de la cadena que se está probando. Si la cadena de búsqueda comienza con y termina con "$", las cadenas deben coincidir exactamente para que la entrada de registro se filtre. Por ejemplo, para probar todas las direcciones IP de un bloque de clase C, debe utilizar una cadena como $231.78.123. para forzar una coincidencia al principio de la cadena. Esto coincidiría con las direcciones 231.78.123.0 a 231.78.123.255.

  3. Guarde el archivo haciendo clic con el botón derecho (modified) en la parte superior de la ventana y haciendo clic en Save.

  4. Para que los cambios realizados localmente surtan efecto, en Profile Manager, haga clic con el botón derecho en la marca de verificación del archivo en la columna User y, a continuación, haga clic en Save to > <profile name>, donde el nombre del perfil es el nombre del perfil del conjunto de datos o del perfil heredado al que pertenece el archivo de inclusión del conjunto de datos.

    No guarde el archivo de configuración modificado en ninguno de los perfiles internos proporcionados por Adobe, ya que los cambios se sobrescriben al instalar actualizaciones en estos perfiles.

    NOTA

    Si es fundamental que las entradas de registro subyacentes utilizadas para construir un conjunto de datos no cambien (aunque cambien las transformaciones utilizadas para construir y actualizar el conjunto de datos y sus dimensiones), el archivo de búsqueda de robots, la línea de base y el archivo de búsqueda de robots, ampliado, deben estar controlados por la versión. Colocar un número de versión en estos archivos garantiza que las actualizaciones de los archivos de búsqueda de robots predeterminados no cambien de forma involuntaria los conjuntos de datos de informes creados anteriormente mediante la adición o eliminación de entradas en estos archivos.

En esta página

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now