Más información sobre la Data Workbench Anuncio de fin de vida útil.
El archivo data workbenchTransform.cfg contiene los parámetros que definen los orígenes de registro, las transformaciones de datos y los exportadores.
Las transformaciones que defina manipularán los datos sin procesar recopilados por los sensores ( .vsl archivos) o incluidos en archivos de texto, archivos XML o bases de datos compatibles con ODBC y mostrarlos en campos existentes, sobrescribiendo los datos actuales o en campos recién definidos.
Para configurar la funcionalidad de transformación, edite el área de trabajo de datos Transform.cfg en la carpeta Dataset del perfil para el que desea exportar los datos de evento. Normalmente, este perfil está dedicado a la funcionalidad de transformación (es decir, no se realiza ningún otro procesamiento de datos que no sea el definido en el área de trabajo de datos) Transform.cfg ). Es importante tener en cuenta que cualquier instrucción de procesamiento especificada en la variable Log Processing Dataset Include los archivos de cualquier perfil heredado se aplican además de los especificados en data workbench Transform.cfg archivo.
Para obtener información sobre los archivos de inclusión de conjuntos de datos, consulte Archivos de inclusión de conjunto de datos.
Si los datos que desea exportar se procesan mediante un clúster de servidores de Data Workbench, cada uno de los servidores de procesamiento (DPU) del clúster procesa los datos, pero solo el primer DPU (servidor de procesamiento número 0 en la profile.cfg ) escribirá los datos de salida en su sistema de archivos local.
Para editar el archivo Transform.cfg de Data Workbench
Parámetro | Descripción |
---|---|
Hora de finalización | Opcional. Filtre los datos para incluir entradas de registro con marcas de tiempo hasta, pero no incluidas, esta vez. Adobe recomienda usar uno de los siguientes formatos para el momento:
Por ejemplo, si especifica 29 de julio de 2013 00:00:00 EDT como Hora de finalización incluye datos hasta el 28 de julio de 2013, a las 11:59:59 PM EDT. Debe especificar una zona horaria. La zona horaria no toma el valor predeterminado GMT si no se especifica. Para obtener una lista de abreviaciones de zona horaria admitidas por el servidor de Data Workbench, consulte Códigos de huso horario . El parámetro Usar hora de inicio/fin para fuentes de archivos de registro y sensor está relacionado con este parámetro. |
Exportadores | Los subcampos de un exportador especifican cómo se procesan y/o dan formato a los datos de salida. Puede definir varios exportadores para un conjunto de orígenes de registro. Cada tipo de exportador crea la salida de forma independiente. Existen tres tipos de exportadores:
Para obtener más información sobre los tipos de exportadores, consulte Definición de exportadores . |
Umbral hash | Opcional. Un factor de muestreo para el submuestreo aleatorio de filas. Si se establece en un número n, solo se selecciona uno de cada n ID de seguimiento para la exportación, lo que reduce el número total de filas exportadas por un factor de n. Para exportar todas las filas, establecería Umbral hash en 1. |
Condición de entrada de registro | Opcional. Define las reglas según las cuales se tienen en cuenta las entradas de registro para la exportación. Para obtener más información sobre la variable Condición de entrada de registro , consulte Archivo de configuración de procesamiento de registros . |
Fuentes de registro | Las fuentes de datos. Fuentes de registro can .vsl archivos, archivos de registro, archivos XML o datos de bases de datos compatibles con ODBC. Para obtener información sobre fuentes de registro , consulte Archivo de configuración de procesamiento de registros . Transformación espera que todos los datos de origen estén en orden cronológico dentro de archivos de entrada ordenados lexicográficamente. Si no se cumple este requisito, los cálculos As de son incorrectos y se pueden procesar datos de entrada adicionales después de cerrar los archivos de salida. |
Modo sin conexión | Opcional. Verdadero o falso. Si es true, Transformación supone que todos los archivos de entrada están presentes cuando comienza a procesar los datos. Cuando se hayan leído todos los datos de entrada, Transformación cierra todos los archivos de salida sin esperar a que se reciban datos adicionales. El valor predeterminado es false.
Nota: If Modo sin conexión se establece en true, Transformación espera que todos los datos de origen estén presentes antes de que se inicie el procesamiento. Se genera un mensaje de advertencia en la variable VisualServer.log si se reciben datos adicionales después de cerrar los archivos de salida. |
Volver a procesar | Opcional. Aquí se puede introducir cualquier carácter o combinación de caracteres. Cambiar este parámetro y guardar el archivo en la variable Transformación el equipo inicia el reprocesamiento de datos. Para obtener información sobre cómo reprocesar los datos, consulte Reprocesamiento y retransformación . |
Etapas | Opcional. Los nombres de las fases de procesamiento que se pueden utilizar en Incluir conjunto de datos de procesamiento de registros archivos que se ejecutan además de Data Workbench Transform.cfg archivo. Las etapas de procesamiento proporcionan una forma de ordenar las transformaciones definidas en Incluir conjunto de datos de procesamiento de registros archivos. Este parámetro es muy útil si ha definido una o más transformaciones dentro de varios Incluir conjunto de datos de procesamiento de registros y desea que se realicen transformaciones específicas en puntos específicos durante el proceso de exportación. El orden en el que se enumeran las etapas determina el orden en el que las transformaciones de la variable Incluir conjunto de datos de procesamiento de registros se ejecutan durante la exportación de datos. Preprocesamiento y Postprocesamiento son fases integradas; Preprocesamiento es siempre la primera etapa, y Postprocesamiento es siempre el último paso. De forma predeterminada, hay un escenario llamado Predeterminado . Adición de una nueva fase de procesamiento
Eliminar una etapa de procesamiento existente
Nota: Cuando se especifica un escenario en un Incluir conjunto de datos de procesamiento de registros el nombre del escenario debe coincidir exactamente con el nombre que escriba aquí. Para obtener más información sobre los archivos de inclusión de conjuntos de datos, consulte Archivos de inclusión de conjunto de datos . |
Hora de inicio | Opcional. Filtre los datos para incluir entradas de registro con marcas de hora en o después de esta hora. Adobe recomienda usar uno de los siguientes formatos para el momento:
Por ejemplo, si especifica 29 de julio de 2013 00:00:00 EDT, ya que la hora de inicio incluye datos a partir del 29 de julio de 2013, a las 12:00:00 AM EDT. Debe especificar una zona horaria. La zona horaria no toma el valor predeterminado GMT si no se especifica. Para obtener una lista de abreviaciones de zona horaria admitidas por el servidor de Data Workbench, consulte Códigos de huso horario .
Nota: El parámetro Usar hora de inicio/fin para fuentes de archivos de registro y sensor está relacionado con este parámetro. |
Transformaciones | Opcional. Define las transformaciones que se deben aplicar a los datos. Para obtener información sobre los tipos de transformación disponibles, consulte Transformaciones de datos .
Nota: Los siguientes tipos de transformación no funcionan cuando se definen en Data Workbench Transform.cfg archivo:
|
Si se reciben datos adicionales después de cerrar los archivos de salida (consulte Log Sources y Offline Mode en la tabla anterior), Transform crea nuevos archivos de salida con los datos adicionales. Los nombres de los nuevos archivos de salida se generan a partir del nombre del archivo de salida original con la adición de un número de versión entre paréntesis justo antes de la extensión. Por ejemplo, si el archivo de salida original es 20070701-ABC.vsl, se nombrarán las versiones posteriores de este archivo 20070701-ABC(1).vsl, 20070701-ABC(2).vsl, etc. Tenga en cuenta que el uso de archivos con versiones como entrada al servidor de Data Workbench puede provocar errores de procesamiento.
Adobe recomienda evitar la creación de archivos de salida con versiones, asegurándose de que todos los datos de origen estén en orden cronológico dentro de archivos de entrada ordenados lexicográficamente y, si Offline Mode se establece en true, es decir, todos los datos de origen están presentes antes de que se inicie el procesamiento. Para obtener más información, consulte la Log Sources y Offline Mode en la tabla anterior.
Agregar transformaciones haciendo clic con el botón derecho Transformations y haga clic en Add new > Transformation type. Complete los campos de transformación.
Consulte Transformaciones de datos para obtener descripciones y ejemplos de las transformaciones que puede utilizar con la funcionalidad de transformación.
Clic con el botón derecho (modified) en la parte superior de la ventana, haga clic en Save.
Para que los cambios realizados localmente tengan efecto, en la variable Profile Manager, haga clic con el botón derecho en la marca de verificación de Data Workbench Transform.cfg en el User y, a continuación, haga clic en Save to > profile name, donde nombre de perfil es el nombre del perfil para el que se exportan datos. El reprocesamiento de los datos comienza después de la sincronización del perfil.
Para obtener información sobre el reprocesamiento de los datos para la exportación, consulte Reprocesamiento y retransformación.