O arquivo data workbenchTransform.cfg contém os parâmetros que definem as fontes de log, as transformações de dados e os exportadores.
As transformações que você define manipulam dados brutos coletados pelos Sensores (arquivos .vsl) ou contidos em arquivos de texto, arquivos XML ou bancos de dados compatíveis com ODBC e os produzem em campos existentes, substituindo os dados atuais ou em campos recém-definidos.
Para configurar a funcionalidade de transformação, edite o arquivo do Data Workbench Transform.cfg na pasta Conjunto de Dados do perfil para o qual deseja exportar dados do evento. Normalmente, esse perfil é dedicado à funcionalidade de transformação (ou seja, você não executa outro processamento de dados diferente do que é definido no arquivo do Data Workbench Transform.cfg). É importante observar que quaisquer instruções de processamento especificadas nos arquivos Log Processing Dataset Include para qualquer perfil herdado são aplicadas além daquelas especificadas no arquivo do Data Workbench Transform.cfg.
Para obter informações sobre arquivos de inclusão do conjunto de dados, consulte Arquivos de inclusão do conjunto de dados.
Se os dados que você deseja exportar forem processados por um cluster de servidores do Data Workbench, cada um dos servidores de processamento (DPUs) no cluster processará os dados, mas somente a primeira DPU (servidor de processamento #0 no arquivo profile.cfg) gravará os dados de saída em seu sistema de arquivos local.
Para editar o arquivo Transform.cfg do Data Workbench
Parâmetro | Descrição |
---|---|
Hora de Término | Opcional. Filtre os dados para incluir entradas de log com carimbos de data e hora atualizados, mas não incluídos desta vez. O Adobe recomenda usar um dos seguintes formatos para o momento:
Por exemplo, especificar 29 de julho de 2013 00:00:00 EDT como a Hora final inclui dados até 28 de julho de 2013, às 11:59:59 EDT. Você deve especificar um fuso horário. O fuso horário não assume GMT como padrão se não estiver especificado. Para obter uma lista de abreviações de fuso horário compatíveis com o servidor do Data Workbench, consulte Códigos de fuso horário . O parâmetro Usar Tempos de Início/Término para Sensor e fontes de arquivo de log está relacionado a esse parâmetro. |
Exportadores | Os subcampos de um exportador especificam como os dados de saída são processados e/ou formatados. Você pode definir vários exportadores para um conjunto de fontes de log. Cada tipo de exportador cria uma produção independente. Existem três tipos de exportadores:
Para obter mais informações sobre tipos de exportadores, consulte Definindo Exportadores . |
Limite de hash | Opcional. Fator de amostragem para a subamostragem aleatória de linhas. Se definido como um número n, então apenas uma de cada n IDs de rastreamento é selecionada para exportação, reduzindo o número total de linhas exportadas por um fator de n. Para exportar todas as linhas, defina o Limite de hash como 1. |
Condição de entrada de log | Opcional. Define as regras pelas quais as entradas de log são consideradas para exportação. Para obter mais informações sobre a Condição de entrada de log , consulte Arquivo de configuração de processamento de log . |
Fontes de log | As fontes de dados. As fontes de log podem ser arquivos .vsl, arquivos de log ou arquivos XML ou dados de bancos de dados compatíveis com ODBC. Para obter informações sobre fontes de log , consulte Arquivo de configuração de processamento de log . Transform espera que todos os dados de origem estejam em ordem cronológica dentro de arquivos de entrada ordenados lexicograficamente. Se este requisito não for satisfeito, Como os cálculos estão incorretos, e os dados de entrada adicionais podem ser processados após o fechamento dos arquivos de saída. |
Modo offline | Opcional. Verdadeiro ou falso. Se verdadeiro, Transformar presume que todos os arquivos de entrada estão presentes quando ele inicia o processamento dos dados. Quando todos os dados de entrada são lidos, Transformar fecha todos os arquivos de saída sem esperar que dados adicionais sejam recebidos. O valor padrão é false.
Observação: Se Modo offline estiver definido como verdadeiro, Transformar espera que todos os dados de origem estejam presentes antes do início do processamento. Uma mensagem de aviso é gerada no arquivo VisualServer.log se dados adicionais forem recebidos após o fechamento dos arquivos de saída. |
Reprocessar | Opcional. Qualquer caractere ou combinação de caracteres pode ser inserida aqui. Alterar esse parâmetro e salvar o arquivo na máquina Transformar inicia o reprocessamento de dados. Para obter informações sobre como reprocessar seus dados, consulte Reprocessando e Retransformação . |
Estágios | Opcional. Os nomes dos estágios de processamento que podem ser usados nos arquivos do conjunto de dados de processamento de log Incluem que são executados além do arquivo do Data Workbench Transform.cfg . As etapas de processamento fornecem uma maneira de ordenar as transformações definidas nos arquivos de Inclusão do Conjunto de Dados de Processamento de Log. Esse parâmetro é muito útil se você tiver definido uma ou mais transformações em vários arquivos de Inclusão do Conjunto de Dados de Processamento de Log e desejar que transformações específicas sejam executadas em pontos específicos durante o processo de exportação. A ordem em que você lista os estágios aqui determina a ordem em que as transformações nos arquivos de Inclusão do Conjunto de Dados de Processamento de Log são executadas durante a exportação de dados. O pré-processamento e o pós-processamento são etapas integradas; O pré-processamento é sempre a primeira etapa e o pós-processamento é sempre a última. Por padrão, há um estágio nomeado chamado Padrão . Para adicionar uma nova etapa de processamento
Para excluir uma etapa de processamento existente
Observação: Quando você especifica um Estágio em um arquivo de Inclusão do Conjunto de Dados de Processamento de Log, o nome do palco deve corresponder exatamente ao nome inserido aqui. Para obter mais informações sobre arquivos de inclusão do conjunto de dados, consulte Arquivos de inclusão do conjunto de dados . |
Hora inicial | Opcional. Filtre os dados para incluir entradas de log com carimbos de data e hora nesse momento ou depois dele. O Adobe recomenda usar um dos seguintes formatos para o momento:
Por exemplo, especificar 29 de julho de 2013 00:00:00 EDT como a Hora de início inclui dados a partir de 29 de julho de 2013, às 12:00:00 EDT. Você deve especificar um fuso horário. O fuso horário não assume GMT como padrão se não estiver especificado. Para obter uma lista de abreviações de fuso horário compatíveis com o servidor do Data Workbench, consulte Códigos de fuso horário .
Observação: O parâmetro Usar Tempos de Início/Término para Sensor e fontes de arquivo de log está relacionado a esse parâmetro. |
Transformações | Opcional. Define as transformações a serem aplicadas aos dados. Para obter informações sobre os tipos de transformação disponíveis, consulte Transformações de dados .
Observação: Os seguintes tipos de transformação não funcionam quando definidos no arquivo Transform.cfg do Data Workbench:
|
Se dados adicionais forem recebidos depois que os arquivos de saída forem fechados (consulte Log Sources e Offline Mode na tabela anterior), Transform criará novos arquivos de saída com os dados adicionais. Os nomes dos novos arquivos de saída são gerados a partir do nome do arquivo de saída original com a adição de um número de versão entre parênteses logo antes da extensão. Por exemplo, se o arquivo de saída original for 20070701-ABC.vsl, as versões subsequentes desse arquivo serão nomeadas 20070701-ABC(1).vsl, 20070701-ABC(2).vsl e assim por diante. Observe que usar os arquivos com versão como entrada no servidor do Data Workbench pode resultar em erros de processamento.
O Adobe recomenda evitar a criação de arquivos de saída com versão, certificando-se de que todos os dados de origem estejam em ordem cronológica dentro de arquivos de entrada lexicograficamente ordenados e, se Offline Mode for definido como true, que todos os dados de origem estejam presentes antes do início do processamento. Para obter mais informações, consulte as entradas Log Sources e Offline Mode na tabela anterior.
Adicione transformações clicando com o botão direito do mouse em Transformations e clicando em Add new > Transformation type. Preencha os campos de transformação.
Consulte Transformações de dados para obter descrições e exemplos das transformações que você pode usar com a funcionalidade de transformação.
Clique com o botão direito do mouse (modified) na parte superior da janela e depois clique em Save.
Para que as alterações feitas localmente entrem em vigor, no Profile Manager, clique com o botão direito do mouse na marca de verificação do Data Workbench Transform.cfg na coluna User, em seguida, clique em Save to > profile name, onde o nome do perfil é o nome do perfil para o qual você está exportando dados. O reprocessamento dos dados começa após a sincronização do perfil.
Para obter informações sobre como reprocessar seus dados para exportação, consulte Reprocessando e Retransformação.