O arquivo Transform.cfg

O arquivo data workbenchTransform.cfg contém os parâmetros que definem as fontes de log, as transformações de dados e os exportadores.

As transformações que você define manipulam dados brutos coletados pelos Sensores (arquivos .vsl) ou contidos em arquivos de texto, arquivos XML ou bancos de dados compatíveis com ODBC e os produzem em campos existentes, substituindo os dados atuais ou em campos recém-definidos.

Para configurar a funcionalidade de transformação, edite o arquivo do Data Workbench Transform.cfg na pasta Conjunto de Dados do perfil para o qual deseja exportar dados do evento. Normalmente, esse perfil é dedicado à funcionalidade de transformação (ou seja, você não executa outro processamento de dados diferente do que é definido no arquivo do Data Workbench Transform.cfg). É importante observar que quaisquer instruções de processamento especificadas nos arquivos Log Processing Dataset Include para qualquer perfil herdado são aplicadas além daquelas especificadas no arquivo do Data Workbench Transform.cfg.

Para obter informações sobre arquivos de inclusão do conjunto de dados, consulte Arquivos de inclusão do conjunto de dados.

Se os dados que você deseja exportar forem processados por um cluster de servidores do Data Workbench, cada um dos servidores de processamento (DPUs) no cluster processará os dados, mas somente a primeira DPU (servidor de processamento #0 no arquivo profile.cfg) gravará os dados de saída em seu sistema de arquivos local.

Para editar o arquivo Transform.cfg do Data Workbench

  1. Ao trabalhar no perfil para o qual deseja exportar dados, abra o Profile Manager e clique em Dataset para mostrar o conteúdo do diretório.
  2. Clique com o botão direito do mouse na marca de seleção ao lado de Data Workbench Transform.cfg e depois clique em Make Local. Uma marca de verificação para este arquivo aparece na coluna User.
  3. Clique com o botão direito do mouse na marca de seleção recém-criada e clique em Open > from the workbench. A janela do Data Workbench Transform.cfg é exibida.
  4. Edite os parâmetros no arquivo de configuração usando a tabela abaixo como guia:
Parâmetro Descrição
Hora de Término

Opcional. Filtre os dados para incluir entradas de log com carimbos de data e hora atualizados, mas não incluídos desta vez. O Adobe recomenda usar um dos seguintes formatos para o momento:

  • 1 de janeiro de 2013HH:MM:SS EDT
  • 1 de janeiro de 2013 HH:MM:SS GMT

Por exemplo, especificar 29 de julho de 2013 00:00:00 EDT como a Hora final inclui dados até 28 de julho de 2013, às 11:59:59 EDT.

Você deve especificar um fuso horário. O fuso horário não assume GMT como padrão se não estiver especificado. Para obter uma lista de abreviações de fuso horário compatíveis com o servidor do Data Workbench, consulte Códigos de fuso horário .

O parâmetro Usar Tempos de Início/Término para Sensor e fontes de arquivo de log está relacionado a esse parâmetro.

Exportadores

Os subcampos de um exportador especificam como os dados de saída são processados e/ou formatados. Você pode definir vários exportadores para um conjunto de fontes de log. Cada tipo de exportador cria uma produção independente.

Existem três tipos de exportadores:

  • ExportarArquivoDeTexto
  • ExportDelimitedTextFile
  • ExportVSLFile

Para obter mais informações sobre tipos de exportadores, consulte Definindo Exportadores .

Limite de hash Opcional. Fator de amostragem para a subamostragem aleatória de linhas. Se definido como um número n, então apenas uma de cada n IDs de rastreamento é selecionada para exportação, reduzindo o número total de linhas exportadas por um fator de n. Para exportar todas as linhas, defina o Limite de hash como 1.
Condição de entrada de log Opcional. Define as regras pelas quais as entradas de log são consideradas para exportação. Para obter mais informações sobre a Condição de entrada de log , consulte Arquivo de configuração de processamento de log .
Fontes de log

As fontes de dados. As fontes de log podem ser arquivos .vsl, arquivos de log ou arquivos XML ou dados de bancos de dados compatíveis com ODBC. Para obter informações sobre fontes de log , consulte Arquivo de configuração de processamento de log .

Transform espera que todos os dados de origem estejam em ordem cronológica dentro de arquivos de entrada ordenados lexicograficamente. Se este requisito não for satisfeito, Como os cálculos estão incorretos, e os dados de entrada adicionais podem ser processados após o fechamento dos arquivos de saída.

Modo offline

Opcional. Verdadeiro ou falso. Se verdadeiro, Transformar presume que todos os arquivos de entrada estão presentes quando ele inicia o processamento dos dados. Quando todos os dados de entrada são lidos, Transformar fecha todos os arquivos de saída sem esperar que dados adicionais sejam recebidos. O valor padrão é false.

Observação: Se Modo offline estiver definido como verdadeiro, Transformar espera que todos os dados de origem estejam presentes antes do início do processamento. Uma mensagem de aviso é gerada no arquivo VisualServer.log se dados adicionais forem recebidos após o fechamento dos arquivos de saída.

Reprocessar

Opcional. Qualquer caractere ou combinação de caracteres pode ser inserida aqui. Alterar esse parâmetro e salvar o arquivo na máquina Transformar inicia o reprocessamento de dados.

Para obter informações sobre como reprocessar seus dados, consulte Reprocessando e Retransformação .

Estágios

Opcional. Os nomes dos estágios de processamento que podem ser usados nos arquivos do conjunto de dados de processamento de log Incluem que são executados além do arquivo do Data Workbench Transform.cfg . As etapas de processamento fornecem uma maneira de ordenar as transformações definidas nos arquivos de Inclusão do Conjunto de Dados de Processamento de Log. Esse parâmetro é muito útil se você tiver definido uma ou mais transformações em vários arquivos de Inclusão do Conjunto de Dados de Processamento de Log e desejar que transformações específicas sejam executadas em pontos específicos durante o processo de exportação.

A ordem em que você lista os estágios aqui determina a ordem em que as transformações nos arquivos de Inclusão do Conjunto de Dados de Processamento de Log são executadas durante a exportação de dados. O pré-processamento e o pós-processamento são etapas integradas; O pré-processamento é sempre a primeira etapa e o pós-processamento é sempre a última. Por padrão, há um estágio nomeado chamado Padrão .

Para adicionar uma nova etapa de processamento

  • Na janela Transform.cfg do Data Workbench, clique com o botão direito do mouse em Estágios e depois clique em Adicionar Novo > Estágio .
  • Insira um nome para o novo estágio.

Para excluir uma etapa de processamento existente

  • Clique com o botão direito do mouse no número correspondente ao estágio que deseja excluir e clique em Remover < #stage_number .

Observação: Quando você especifica um Estágio em um arquivo de Inclusão do Conjunto de Dados de Processamento de Log, o nome do palco deve corresponder exatamente ao nome inserido aqui. Para obter mais informações sobre arquivos de inclusão do conjunto de dados, consulte Arquivos de inclusão do conjunto de dados .

Hora inicial

Opcional. Filtre os dados para incluir entradas de log com carimbos de data e hora nesse momento ou depois dele. O Adobe recomenda usar um dos seguintes formatos para o momento:

  • 1 de janeiro de 2013 HH:MM:SS EDT
  • 1 de janeiro de 2013 HH:MM:SS GMT

Por exemplo, especificar 29 de julho de 2013 00:00:00 EDT como a Hora de início inclui dados a partir de 29 de julho de 2013, às 12:00:00 EDT.

Você deve especificar um fuso horário. O fuso horário não assume GMT como padrão se não estiver especificado. Para obter uma lista de abreviações de fuso horário compatíveis com o servidor do Data Workbench, consulte Códigos de fuso horário .

Observação: O parâmetro Usar Tempos de Início/Término para Sensor e fontes de arquivo de log está relacionado a esse parâmetro.

Transformações

Opcional. Define as transformações a serem aplicadas aos dados. Para obter informações sobre os tipos de transformação disponíveis, consulte Transformações de dados .

Observação: Os seguintes tipos de transformação não funcionam quando definidos no arquivo Transform.cfg do Data Workbench:

  • AppendURI
  • CrossRows
  • ODBCLookup
  • Sessionize
OBSERVAÇÃO

Se dados adicionais forem recebidos depois que os arquivos de saída forem fechados (consulte Log Sources e Offline Mode na tabela anterior), Transform criará novos arquivos de saída com os dados adicionais. Os nomes dos novos arquivos de saída são gerados a partir do nome do arquivo de saída original com a adição de um número de versão entre parênteses logo antes da extensão. Por exemplo, se o arquivo de saída original for 20070701-ABC.vsl, as versões subsequentes desse arquivo serão nomeadas 20070701-ABC(1).vsl, 20070701-ABC(2).vsl e assim por diante. Observe que usar os arquivos com versão como entrada no servidor do Data Workbench pode resultar em erros de processamento.

O Adobe recomenda evitar a criação de arquivos de saída com versão, certificando-se de que todos os dados de origem estejam em ordem cronológica dentro de arquivos de entrada lexicograficamente ordenados e, se Offline Mode for definido como true, que todos os dados de origem estejam presentes antes do início do processamento. Para obter mais informações, consulte as entradas Log Sources e Offline Mode na tabela anterior.

  1. Adicione transformações clicando com o botão direito do mouse em Transformations e clicando em Add new > Transformation type. Preencha os campos de transformação.

    Consulte Transformações de dados para obter descrições e exemplos das transformações que você pode usar com a funcionalidade de transformação.

  2. Clique com o botão direito do mouse (modified) na parte superior da janela e depois clique em Save.

  3. Para que as alterações feitas localmente entrem em vigor, no Profile Manager, clique com o botão direito do mouse na marca de verificação do Data Workbench Transform.cfg na coluna User, em seguida, clique em Save to > profile name, onde o nome do perfil é o nome do perfil para o qual você está exportando dados. O reprocessamento dos dados começa após a sincronização do perfil.

    OBSERVAÇÃO

    Para obter informações sobre como reprocessar seus dados para exportação, consulte Reprocessando e Retransformação.

Nesta página

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now