Le fichier Transform.cfg

Le fichier Data WorkbenchTransform.cfg contient les paramètres qui définissent les sources de journaux, les transformations de données et les exportateurs.

Les transformations que vous définissez manipulent les données brutes collectées par les capteurs (fichiers .vsl) ou contenues dans des fichiers texte, des fichiers XML ou des bases de données conformes à ODBC et les génèrent soit dans des champs existants, en remplaçant les données actives, soit dans des champs nouvellement définis.

Pour configurer la fonctionnalité de transformation, vous modifiez le fichier Data Workbench Transform.cfg dans le dossier Jeu de données pour le profil pour lequel vous souhaitez exporter les données d’événement. En règle générale, ce profil est dédié à la fonctionnalité de transformation (c’est-à-dire que vous n’effectuez aucun traitement de données autre que celui défini dans le fichier Transform.cfg Data Workbench). Il est important de noter que toutes les instructions de traitement spécifiées dans les fichiers Log Processing Dataset Include pour tous les profils hérités sont appliquées en plus de celles spécifiées dans le fichier Transform.cfg Data Workbench.

Pour plus d’informations sur les fichiers d’inclusion de jeux de données, voir Fichiers d’inclusion de jeux de données.

Si les données que vous souhaitez exporter sont traitées par une grappe de serveurs Data Workbench, chacun des serveurs de traitement (DPU) de la grappe traite les données, mais seul le premier DPU (serveur de traitement #0 dans le fichier profile.cfg) écrira les données de sortie dans son système de fichiers local.

Pour modifier le fichier Transform.cfg de Data Workbench

  1. Lorsque vous travaillez dans le profil pour lequel vous souhaitez exporter des données, ouvrez Profile Manager et cliquez sur Dataset pour afficher le contenu du répertoire.
  2. Cliquez avec le bouton droit de la souris sur la coche en regard de Data Workbench Transform.cfg, puis cliquez sur Make Local. Une coche pour ce fichier apparaît dans la colonne User.
  3. Cliquez avec le bouton droit de la souris sur la coche nouvellement créée, puis cliquez sur Open > from the workbench. La fenêtre Data Workbench Transform.cfg s’affiche.
  4. Modifiez les paramètres du fichier de configuration à l’aide du tableau ci-dessous comme guide :
Paramètre Description
Heure de fin

Facultatif. Filtrez les données pour inclure les entrées du journal avec horodatages jusqu’à cette heure, mais sans les inclure. Adobe recommande d’utiliser l’un des formats suivants pour l’heure :

  • 1er janvier 2013HH:MM:SS EDT
  • 1er janvier 2013 HH:MM:SS GMT

Par exemple, la spécification du 29 juillet 2013 00:00:00 EDT comme Heure de fin inclut des données jusqu’au 28 juillet 2013, à 11:59:59 PM EDT.

Vous devez spécifier un fuseau horaire. Le fuseau horaire n’est pas défini par défaut sur GMT s’il n’est pas spécifié. Pour obtenir la liste des abréviations de fuseau horaire prises en charge par le serveur Data Workbench, voir Codes de fuseau horaire .

Le paramètre Utiliser les heures de début et de fin pour les sources de fichiers journaux et Capteur est associé à ce paramètre.

Exportateurs

Les sous-champs d'un exportateur spécifient le mode de traitement et/ou de formatage des données de sortie. Vous pouvez définir plusieurs exportateurs pour un ensemble de sources de journal. Chaque type d’exportateur crée une sortie indépendamment.

Il existe trois types d'exportateurs :

  • ExportTextFile
  • ExportDelimitedTextFile
  • ExportVSLFile

Pour plus d’informations sur les types d’exportateurs, voir Définition des exportateurs .

Seuil de hachage Facultatif. Facteur d’échantillonnage pour un sous-échantillonnage aléatoire de lignes. S’il est défini sur un nombre n, un seul identifiant de suivi sur chaque n est sélectionné pour l’exportation, ce qui réduit le nombre total de lignes exportées par un facteur n. Pour exporter toutes les lignes, définissez le Seuil de hachage sur 1.
Condition d’entrée du journal Facultatif. Définit les règles selon lesquelles les entrées de journal sont prises en compte pour l’exportation. Pour plus d’informations sur la condition d’entrée du journal , voir fichier de configuration de traitement du journal .
Sources de journalisation

Sources des données. Les sources de journal peuvent être des fichiers .vsl, des fichiers journaux ou des fichiers XML ou des données provenant de bases de données compatibles avec ODBC. Pour plus d’informations sur sources de journal , voir Fichier de configuration de traitement du journal .

Transform s’attend à ce que toutes les données source soient dans l’ordre chronologique au sein de fichiers d’entrée triés lexicographiquement. Si cette exigence n’est pas satisfaite, les calculs "À partir de" sont incorrects et des données d’entrée supplémentaires peuvent être traitées après la fermeture des fichiers de sortie.

Mode hors ligne

Facultatif. Vrai ou faux. Si la valeur est true, Transform suppose que tous les fichiers d’entrée sont présents lorsqu’il commence à traiter les données. Une fois toutes les données d’entrée lues, Transform ferme tous les fichiers de sortie sans attendre que des données supplémentaires soient reçues. La valeur par défaut est false.

Remarque : Si Mode hors ligne est défini sur true, Transform s’attend à ce que toutes les données source soient présentes avant le début du traitement. Un message d’avertissement est généré dans le fichier VisualServer.log si des données supplémentaires sont reçues une fois les fichiers de sortie fermés.

Retraiter

Facultatif. N’importe quel caractère ou combinaison de caractères peut être saisi ici. La modification de ce paramètre et l’enregistrement du fichier sur la machine Transform lance le retraitement des données.

Pour plus d’informations sur le retraitement de vos données, voir Retraitement et retransformation .

Phases

Facultatif. Les noms des étapes de traitement pouvant être utilisées dans le jeu de données de traitement du journal incluent les fichiers qui sont exécutés en plus du fichier Data Workbench Transform.cfg . Les étapes de traitement permettent d’organiser les transformations définies dans les fichiers Jeu de données de traitement du journal contenant les fichiers . Ce paramètre est très utile si vous avez défini une ou plusieurs transformations dans plusieurs fichiers Jeu de données de traitement du journal contenant et que vous souhaitez que des transformations spécifiques soient effectuées à des moments spécifiques pendant le processus d’exportation.

L’ordre dans lequel vous listez les étapes détermine l’ordre dans lequel les transformations des fichiers Jeu de données de traitement du journal (y compris ) sont exécutées lors de l’exportation des données. Le prétraitement et le posttraitement sont des étapes intégrées ; Le prétraitement est toujours la première étape et le posttraitement est toujours la dernière étape. Par défaut, il existe une étape nommée Par défaut .

Pour ajouter une nouvelle étape de traitement

  • Dans la fenêtre Data Workbench Transform.cfg , cliquez avec le bouton droit de la souris sur Étapes , puis cliquez sur Ajouter > Étape .
  • Saisissez le nom de la nouvelle étape.

Pour supprimer une étape de traitement existante

  • Cliquez avec le bouton droit de la souris sur le numéro correspondant à l’étape que vous souhaitez supprimer, puis cliquez sur Supprimer < #stage_number .

Remarque : Lorsque vous spécifiez une étape dans un fichier Jeu de données de traitement du journal Inclure , le nom de l’étape doit correspondre exactement au nom que vous saisissez ici. Pour plus d’informations sur les fichiers d’inclusion de jeux de données, voir Fichiers d’inclusion de jeux de données .

Heure de début

Facultatif. Filtrez les données pour inclure les entrées du journal avec horodatages à cette heure ou après cette heure. Adobe recommande d’utiliser l’un des formats suivants pour l’heure :

  • 1er janvier 2013 HH:MM:SS EDT
  • 1er janvier 2013 HH:MM:SS GMT

Par exemple, la spécification du 29 juillet 2013 00:00:00 EDT comme heure de début inclut des données à partir du 29 juillet 2013, à 12:00:00 AM EDT.

Vous devez spécifier un fuseau horaire. Le fuseau horaire n’est pas défini par défaut sur GMT s’il n’est pas spécifié. Pour obtenir la liste des abréviations de fuseau horaire prises en charge par le serveur Data Workbench, voir Codes de fuseau horaire .

Remarque : Le paramètre Utiliser les heures de début et de fin pour les sources de fichiers journaux et Capteur est associé à ce paramètre.

Transformations

Facultatif. Définit les transformations à appliquer aux données. Pour plus d’informations sur les types de transformation disponibles, voir Transformations de données .

Remarque : Les types de transformation suivants ne fonctionnent pas lorsqu’ils sont définis dans le fichier Data Workbench Transform.cfg :

  • AppendURI
  • CrossRows
  • ODBCLookup
  • Sessionize
REMARQUE

Si des données additionnelles sont reçues une fois les fichiers de sortie fermés (voir Log Sources et Offline Mode dans le tableau précédent), Transform crée de nouveaux fichiers de sortie avec les données additionnelles. Les noms des nouveaux fichiers de sortie sont générés à partir du nom du fichier de sortie d’origine avec l’ajout d’un numéro de version entre parenthèses juste avant l’extension. Par exemple, si le fichier de sortie d’origine est 20070701-ABC.vsl, les versions suivantes de ce fichier seront nommées 20070701-ABC(1).vsl, 20070701-ABC(2).vsl, etc. Notez que l’utilisation des fichiers versionnés en tant qu’entrée au serveur Data Workbench peut entraîner des erreurs de traitement.

Adobe recommande d’éviter la création de fichiers de sortie versionnés en s’assurant que toutes les données source sont dans l’ordre chronologique dans les fichiers d’entrée triés lexicographiquement et, si Offline Mode est défini sur true, que toutes les données source sont présentes avant le début du traitement. Pour plus d’informations, voir les entrées Log Sources et Offline Mode du tableau précédent.

  1. Ajoutez des transformations en cliquant avec le bouton droit de la souris sur Transformations et en cliquant sur Add new > Transformation type. Renseignez les champs de transformation.

    Voir Transformations de données pour obtenir des descriptions et des exemples des transformations que vous pouvez utiliser avec les fonctionnalités de transformation.

  2. Cliquez avec le bouton droit de la souris sur (modified) en haut de la fenêtre, puis cliquez sur Save.

  3. Pour que les modifications apportées localement prennent effet, dans la balise Profile Manager, cliquez avec le bouton droit de la souris sur la coche de Data Workbench Transform.cfg dans la colonne User, puis cliquez sur Save to > profile name, où le nom du profil est le nom du profil pour lequel vous exportez des données. Le retraitement des données commence après la synchronisation du profil.

    REMARQUE

    Pour plus d’informations sur le retraitement de vos données à exporter, voir Retraitement et retransformation.

Sur cette page