Grupos de decodificadores de archivos de texto

IMPORTANTE

Más información sobre la Data Workbench Anuncio de fin de vida útil.

El procesamiento de archivos de registro como fuentes de registro requiere la definición de un decodificador dentro del archivo Incluir conjunto de datos de procesamiento de registros para extraer campos de datos de las entradas de registro.

La definición de grupos de decodificadores de archivos de texto para las fuentes de registro de archivos de registro requiere conocer la estructura y el contenido del archivo de registro, los datos que se extraerán y los campos en los que se almacenan esos datos. En esta sección se proporcionan descripciones básicas de los parámetros que se pueden especificar para los descodificadores, pero la forma en que se utiliza cualquier descodificador depende del archivo de registro que contiene los datos de origen.

Para obtener información sobre los requisitos de formato para las fuentes de registro de archivos de registro, consulte Archivos de registro. Para obtener ayuda con la definición de descodificadores de archivos de texto, póngase en contacto con el Adobe.

Un grupo de descodificadores de archivos de texto puede incluir:

Decodificadores de expresiones regulares

Un decodificador de expresiones regulares identifica patrones de cadena complejos dentro de las entradas de registro en un archivo de registro y extrae estos patrones como campos de datos. Para cada decodificador, el número de campos debe ser igual al número de subpatrones de captura en la expresión regular. La parte de la línea que coincide con el subpatrón de captura nth se asigna al campo nth para esa línea.

Adición de un decodificador de expresiones regulares a un grupo de decodificadores de archivos de texto

  1. Abra el Log Processing Dataset Include tal como se describe en Edición de archivos de inclusión de conjuntos de datos existentes y agregue un grupo de descodificadores de archivos de texto. Consulte la entrada de tabla Grupos de decodificadores.

  2. Clic con el botón derecho Decoders en el grupo decodificador recién creado, haga clic en Add new > Regular Expression.

  3. Especifique la siguiente información:

    • Campos: Lista de los campos del archivo de registro. Si se va a pasar cualquiera de los campos definidos aquí a la fase de transformación de la construcción del conjunto de datos, esos campos deben incluirse en el parámetro Fields de uno de los Log Processing Dataset Include archivos para el conjunto de datos. Los nombres de campo personalizados deben comenzar por "x-".

    • Nombre: Identificador opcional del decodificador.

    • Expresión regular: Se utiliza para extraer los campos deseados de cada línea del archivo.

  4. Repita los pasos 4 y 5 para cualquier otro descodificador que desee agregar al grupo.

  5. Para guardar la variable Log Processing Dataset Include archivo, clic con el botón derecho (modified) en la parte superior de la ventana y haga clic en Save.

  6. Para que los cambios realizados localmente tengan efecto, en la variable Profile Manager, haga clic con el botón derecho en la marca de verificación del archivo en la variable User para abrir el Navegador. Haga clic en Save to > <profile name>, donde nombre de perfil es el nombre del perfil del conjunto de datos o el perfil heredado al que pertenece el archivo de inclusión del conjunto de datos.

No guarde el archivo de configuración modificado en ninguno de los perfiles internos proporcionados por Adobe, ya que los cambios se sobrescriben al instalar actualizaciones en estos perfiles.

NOTA

Un archivo de registro determinado puede tener varios descodificadores de expresión regular. El orden en que se definen los descodificadores es importante: el primer decodificador que coincida con una línea en el archivo de registro es el que se utiliza para descodificar esa línea.

Este ejemplo ilustra el uso de un decodificador de expresiones regulares para extraer campos de datos de un archivo de texto delimitado por tabuladores. Puede obtener el mismo resultado definiendo un decodificador delimitado con un delimitador de tabulación.

Para obtener más información sobre los descodificadores de expresiones regulares, incluida la terminología y la sintaxis, consulte Expresiones regulares.

Decodificadores delimitados

Un decodificador delimitado descodifica un archivo de registro cuyos campos están delimitados por un solo carácter. El número de campos debe corresponder al número de columnas del archivo delimitado; sin embargo, no es necesario nombrar todos los campos. Si un campo se deja en blanco, la columna sigue siendo necesaria en el archivo de registro, pero el decodificador la ignora.

Adición de un decodificador delimitado a un grupo de decodificadores de archivos de texto

  1. Abra el Log Processing Dataset Include tal como se describe en Edición de archivos de inclusión de conjuntos de datos existentes y agregue un grupo de descodificadores de archivos de texto. Consulte la entrada de tabla Grupos de decodificadores.

  2. Clic con el botón derecho Decoders en el grupo decodificador recién creado, haga clic en Add new > Delimited.

  3. Especifique la siguiente información:

    • Campos: Lista de los campos del archivo de registro. Si se va a pasar cualquiera de los campos definidos aquí a la fase de transformación de la construcción del conjunto de datos, esos campos deben incluirse en el parámetro Fields de uno de los Log Processing Dataset Include archivos para el conjunto de datos. Los nombres de campo personalizados deben comenzar por "x-".

    • Delimitador: Carácter que se utiliza para separar campos en el archivo de salida.

  4. Repita los pasos 4 y 5 para cualquier otro descodificador que desee agregar al grupo.

  5. Para guardar la variable Log Processing Dataset Include archivo, clic con el botón derecho (modified) en la parte superior de la ventana y haga clic en Save.

  6. Para que los cambios realizados localmente tengan efecto, en la variable Profile Manager, haga clic con el botón derecho en la marca de verificación del archivo en la variable User y, a continuación, haga clic en Save to > <profile name>, donde nombre de perfil es el nombre del perfil del conjunto de datos o el perfil heredado al que pertenece el archivo de inclusión del conjunto de datos.

NOTA

No guarde el archivo de configuración modificado en ninguno de los perfiles internos proporcionados por Adobe, ya que los cambios se sobrescriben al instalar actualizaciones en estos perfiles.

Este ejemplo ilustra el uso de un decodificador delimitado para extraer campos de datos de un archivo de texto delimitado por comas que contiene datos sobre películas.

En esta página