Grupos do decodificador de arquivos de texto

Última atualização em 2022-10-05
  • Criado para:
  • User
    Admin
IMPORTANTE

Leia mais sobre Datas Workbench Anúncio do fim da vida útil.

O processamento de arquivos de log como fontes de log requer a definição de um decodificador no arquivo de Inclusão do Conjunto de Dados de Processamento de Log para extrair campos de dados das entradas de log.

A definição de grupos do decodificador de arquivos de texto para fontes de log requer conhecimento da estrutura e do conteúdo do arquivo de log, dos dados a serem extraídos e dos campos nos quais esses dados são armazenados. Esta seção fornece descrições básicas dos parâmetros que você pode especificar para decodificadores, mas a maneira como você usa qualquer decodificador depende do arquivo de log que contém seus dados de origem.

Para obter informações sobre os requisitos de formato para fontes de log do arquivo de log, consulte Arquivos de registro. Para obter ajuda com a definição de decodificadores de arquivos de texto, entre em contato com o Adobe.

Um grupo de decodificador de arquivos de texto pode incluir:

Decodificadores de expressão regular

Um decodificador de expressão regular identifica padrões complexos de sequência de caracteres nas entradas de log em um arquivo de log e extrai esses padrões como campos de dados. Para cada decodificador, o número de campos deve ser igual ao número de subpadrões de captura na expressão regular. A parte da linha que corresponde ao subpadrão de captura nth é atribuída ao campo nth dessa linha.

Para adicionar um decodificador de expressão regular a um grupo de decodificador de arquivo de texto

  1. Abra o Log Processing Dataset Include como descrito em Editar arquivos de inclusão existentes do conjunto de dados e adicionar um grupo decodificador de arquivo de texto. Consulte a entrada da tabela Grupos do decodificador.

  2. Clique com o botão direito Decoders no grupo decodificador recém-criado, clique em Add new > Regular Expression.

  3. Especifique as seguintes informações:

    • Campos: Lista dos campos no arquivo de log. Se qualquer um dos campos definidos aqui for passado para a fase de transformação da construção do conjunto de dados, esses campos deverão ser listados no parâmetro Fields de um dos Log Processing Dataset Include arquivos para o conjunto de dados. Os nomes de campos personalizados devem começar com "x-".

    • Nome: Identificador opcional para o decodificador.

    • Expressão regular: Usado para extrair os campos desejados de cada linha no arquivo.

  4. Repita as etapas 4 e 5 para qualquer outro decodificador que deseja adicionar ao grupo.

  5. Para salvar o Log Processing Dataset Include , clique com o botão direito do mouse (modified) na parte superior da janela e clique em Save.

  6. Para que as alterações feitas localmente entrem em vigor, no Profile Manager, clique com o botão direito do mouse na marca de seleção do arquivo no User coluna. Clique em Save to > <profile name>, em que o nome do perfil é o nome do perfil do conjunto de dados ou o perfil herdado ao qual o arquivo de inclusão do conjunto de dados pertence.

Não salve o arquivo de configuração modificado em nenhum dos perfis internos fornecidos pelo Adobe, pois as alterações são substituídas ao instalar atualizações nesses perfis.

OBSERVAÇÃO

Um determinado arquivo de log pode ter vários decodificadores de expressão regular. A ordem em que você define os decodificadores é importante: o primeiro decodificador a corresponder a uma linha no arquivo de log é o usado para decodificar essa linha.

Este exemplo ilustra o uso de um decodificador de expressão regular para extrair campos de dados de um arquivo de texto delimitado por tabulação. Você pode obter o mesmo resultado definindo um decodificador delimitado com um delimitador de tabulação.

Para obter mais informações sobre decodificadores de expressão regular, incluindo terminologia e sintaxe, consulte Expressões regulares.

Decodificadores Delimitados

Um decodificador delimitado decodifica um arquivo de log cujos campos são delimitados por um único caractere. O número de campos deve corresponder ao número de colunas no arquivo delimitado; no entanto, nem todos os campos precisam ser nomeados. Se um campo ficar em branco, a coluna ainda será necessária no arquivo de log, mas o decodificador o ignorará.

Para adicionar um decodificador delimitado a um grupo de decodificadores de arquivo de texto

  1. Abra o Log Processing Dataset Include como descrito em Editar arquivos de inclusão existentes do conjunto de dados e adicionar um grupo decodificador de arquivo de texto. Consulte a entrada da tabela Grupos do decodificador.

  2. Clique com o botão direito Decoders no grupo decodificador recém-criado, clique em Add new > Delimited.

  3. Especifique as seguintes informações:

    • Campos: Lista dos campos no arquivo de log. Se qualquer um dos campos definidos aqui for passado para a fase de transformação da construção do conjunto de dados, esses campos deverão ser listados no parâmetro Fields de um dos Log Processing Dataset Include arquivos para o conjunto de dados. Os nomes de campos personalizados devem começar com "x-".

    • Delimitador: Caractere usado para separar campos no arquivo de saída.

  4. Repita as etapas 4 e 5 para qualquer outro decodificador que deseja adicionar ao grupo.

  5. Para salvar o Log Processing Dataset Include , clique com o botão direito do mouse (modified) na parte superior da janela e clique em Save.

  6. Para que as alterações feitas localmente entrem em vigor, no Profile Manager, clique com o botão direito do mouse na marca de seleção do arquivo no User e, em seguida, clique em Save to > <profile name>, em que o nome do perfil é o nome do perfil do conjunto de dados ou o perfil herdado ao qual o arquivo de inclusão do conjunto de dados pertence.

OBSERVAÇÃO

Não salve o arquivo de configuração modificado em nenhum dos perfis internos fornecidos pelo Adobe, pois as alterações são substituídas ao instalar atualizações nesses perfis.

Este exemplo ilustra o uso de um decodificador delimitado para extrair campos de dados de um arquivo de texto delimitado por vírgulas contendo dados sobre filmes.

Nesta página