Grupos do decodificador de arquivos de texto

O processamento de arquivos de log como fontes de log requer a definição de um decodificador no arquivo de Inclusão do Conjunto de Dados de Processamento de Log para extrair campos de dados das entradas de log.

A definição de grupos do decodificador de arquivos de texto para fontes de log requer conhecimento da estrutura e do conteúdo do arquivo de log, dos dados a serem extraídos e dos campos nos quais esses dados são armazenados. Esta seção fornece descrições básicas dos parâmetros que você pode especificar para decodificadores, mas a maneira como você usa qualquer decodificador depende do arquivo de log que contém seus dados de origem.

Para obter informações sobre os requisitos de formato para fontes de log do arquivo de log, consulte Arquivos de Log. Para obter ajuda com a definição de decodificadores de arquivos de texto, entre em contato com o Adobe.

Um grupo de decodificador de arquivos de texto pode incluir:

Decodificadores de expressão regular

Um decodificador de expressão regular identifica padrões complexos de sequência de caracteres nas entradas de log em um arquivo de log e extrai esses padrões como campos de dados. Para cada decodificador, o número de campos deve ser igual ao número de subpadrões de captura na expressão regular. A parte da linha que corresponde ao subpadrão de captura nth é atribuída ao campo nth dessa linha.

Para adicionar um decodificador de expressão regular a um grupo de decodificador de arquivo de texto

  1. Abra o arquivo Log Processing Dataset Include conforme descrito em Editar arquivos de inclusão existentes do conjunto de dados e adicione um grupo de decodificador de arquivo de texto. Consulte a entrada da tabela Grupos do decodificador.

  2. Clique com o botão direito do mouse Decoders no grupo de decodificadores recém-criado e clique em Add new > Regular Expression.

  3. Especifique as seguintes informações:

    • Campos: Lista dos campos no arquivo de log. Se qualquer um dos campos definidos aqui for passado para a fase de transformação da construção do conjunto de dados, esses campos deverão ser listados no parâmetro Fields de um dos arquivos Log Processing Dataset Include para o conjunto de dados. Os nomes de campos personalizados devem começar com "x-".

    • Nome: identificador opcional do decodificador.

    • Expressão regular: usada para extrair os campos desejados de cada linha no arquivo.

  4. Repita as etapas 4 e 5 para qualquer outro decodificador que deseja adicionar ao grupo.

  5. Para salvar o arquivo Log Processing Dataset Include, clique com o botão direito do mouse (modified) na parte superior da janela e clique em Save.

  6. Para que as alterações feitas localmente entrem em vigor, no Profile Manager, clique com o botão direito do mouse na marca de seleção do arquivo na coluna User. Clique em Save to > <profile name, onde o nome do perfil é o nome do perfil do conjunto de dados ou o perfil herdado ao qual pertence o arquivo de inclusão do conjunto de dados.

Não salve o arquivo de configuração modificado em nenhum dos perfis internos fornecidos pelo Adobe, pois as alterações são substituídas ao instalar atualizações nesses perfis.

OBSERVAÇÃO

Um determinado arquivo de log pode ter vários decodificadores de expressão regular. A ordem em que você define os decodificadores é importante: o primeiro decodificador a corresponder a uma linha no arquivo de log é o usado para decodificar essa linha.

Este exemplo ilustra o uso de um decodificador de expressão regular para extrair campos de dados de um arquivo de texto delimitado por tabulação. Você pode obter o mesmo resultado definindo um decodificador delimitado com um delimitador de tabulação.

Para obter mais informações sobre decodificadores de expressão regular, incluindo terminologia e sintaxe, consulte Expressões regulares.

Decodificadores Delimitados

Um decodificador delimitado decodifica um arquivo de log cujos campos são delimitados por um único caractere. O número de campos deve corresponder ao número de colunas no arquivo delimitado; no entanto, nem todos os campos precisam ser nomeados. Se um campo ficar em branco, a coluna ainda será necessária no arquivo de log, mas o decodificador o ignorará.

Para adicionar um decodificador delimitado a um grupo de decodificadores de arquivo de texto

  1. Abra o arquivo Log Processing Dataset Include conforme descrito em Editar arquivos de inclusão existentes do conjunto de dados e adicione um grupo de decodificador de arquivo de texto. Consulte a entrada da tabela Grupos do decodificador.

  2. Clique com o botão direito do mouse Decoders no grupo de decodificadores recém-criado e clique em Add new > Delimited.

  3. Especifique as seguintes informações:

    • Campos: Lista dos campos no arquivo de log. Se qualquer um dos campos definidos aqui for passado para a fase de transformação da construção do conjunto de dados, esses campos deverão ser listados no parâmetro Fields de um dos arquivos Log Processing Dataset Include para o conjunto de dados. Os nomes de campos personalizados devem começar com "x-".

    • Delimitador: caractere usado para separar campos no arquivo de saída.

  4. Repita as etapas 4 e 5 para qualquer outro decodificador que deseja adicionar ao grupo.

  5. Para salvar o arquivo Log Processing Dataset Include, clique com o botão direito do mouse (modified) na parte superior da janela e clique em Save.

  6. Para que as alterações feitas localmente tenham efeito, no Profile Manager, clique com o botão direito do mouse na marca de seleção do arquivo na coluna User e clique em Save to > <profile name, onde o nome do perfil é o nome do perfil do conjunto de dados ou do perfil herdado ao qual pertence o arquivo de inclusão do conjunto de dados.

OBSERVAÇÃO

Não salve o arquivo de configuração modificado em nenhum dos perfis internos fornecidos pelo Adobe, pois as alterações são substituídas ao instalar atualizações nesses perfis.

Este exemplo ilustra o uso de um decodificador delimitado para extrair campos de dados de um arquivo de texto delimitado por vírgulas contendo dados sobre filmes.

Nesta página