Le fichier Data WorkbenchTransform.cfg contient les paramètres qui définissent les sources de journaux, les transformations de données et les exportateurs.
Les transformations que vous définissez manipulent les données brutes collectées par les capteurs (fichiers .vsl) ou contenues dans des fichiers texte, des fichiers XML ou des bases de données conformes à ODBC et les génèrent soit dans des champs existants, en remplaçant les données actives, soit dans des champs nouvellement définis.
Pour configurer la fonctionnalité de transformation, vous modifiez le fichier Data Workbench Transform.cfg dans le dossier Jeu de données pour le profil pour lequel vous souhaitez exporter les données d’événement. En règle générale, ce profil est dédié à la fonctionnalité de transformation (c’est-à-dire que vous n’effectuez aucun traitement de données autre que celui défini dans le fichier Transform.cfg Data Workbench). Il est important de noter que toutes les instructions de traitement spécifiées dans les fichiers Log Processing Dataset Include pour tous les profils hérités sont appliquées en plus de celles spécifiées dans le fichier Transform.cfg Data Workbench.
Pour plus d’informations sur les fichiers d’inclusion de jeux de données, voir Fichiers d’inclusion de jeux de données.
Si les données que vous souhaitez exporter sont traitées par une grappe de serveurs Data Workbench, chacun des serveurs de traitement (DPU) de la grappe traite les données, mais seul le premier DPU (serveur de traitement #0 dans le fichier profile.cfg) écrira les données de sortie dans son système de fichiers local.
Pour modifier le fichier Transform.cfg de Data Workbench
| Paramètre | Description |
|---|---|
| Heure de fin | Facultatif. Filtrez les données pour inclure les entrées du journal avec horodatages jusqu’à cette heure, mais sans les inclure. Adobe recommande d’utiliser l’un des formats suivants pour l’heure :
Par exemple, la spécification du 29 juillet 2013 00:00:00 EDT comme Heure de fin inclut des données jusqu’au 28 juillet 2013, à 11:59:59 PM EDT. Vous devez spécifier un fuseau horaire. Le fuseau horaire n’est pas défini par défaut sur GMT s’il n’est pas spécifié. Pour obtenir la liste des abréviations de fuseau horaire prises en charge par le serveur Data Workbench, voir Codes de fuseau horaire . Le paramètre Utiliser les heures de début et de fin pour les sources de fichiers journaux et Capteur est associé à ce paramètre. |
| Exportateurs | Les sous-champs d'un exportateur spécifient le mode de traitement et/ou de formatage des données de sortie. Vous pouvez définir plusieurs exportateurs pour un ensemble de sources de journal. Chaque type d’exportateur crée une sortie indépendamment. Il existe trois types d'exportateurs :
Pour plus d’informations sur les types d’exportateurs, voir Définition des exportateurs . |
| Seuil de hachage | Facultatif. Facteur d’échantillonnage pour un sous-échantillonnage aléatoire de lignes. S’il est défini sur un nombre n, un seul identifiant de suivi sur chaque n est sélectionné pour l’exportation, ce qui réduit le nombre total de lignes exportées par un facteur n. Pour exporter toutes les lignes, définissez le Seuil de hachage sur 1. |
| Condition d’entrée du journal | Facultatif. Définit les règles selon lesquelles les entrées de journal sont prises en compte pour l’exportation. Pour plus d’informations sur la condition d’entrée du journal , voir fichier de configuration de traitement du journal . |
| Sources de journalisation | Sources des données. Les sources de journal peuvent être des fichiers .vsl, des fichiers journaux ou des fichiers XML ou des données provenant de bases de données compatibles avec ODBC. Pour plus d’informations sur sources de journal , voir Fichier de configuration de traitement du journal . Transform s’attend à ce que toutes les données source soient dans l’ordre chronologique au sein de fichiers d’entrée triés lexicographiquement. Si cette exigence n’est pas satisfaite, les calculs "À partir de" sont incorrects et des données d’entrée supplémentaires peuvent être traitées après la fermeture des fichiers de sortie. |
| Mode hors ligne | Facultatif. Vrai ou faux. Si la valeur est true, Transform suppose que tous les fichiers d’entrée sont présents lorsqu’il commence à traiter les données. Une fois toutes les données d’entrée lues, Transform ferme tous les fichiers de sortie sans attendre que des données supplémentaires soient reçues. La valeur par défaut est false.
Remarque : Si Mode hors ligne est défini sur true, Transform s’attend à ce que toutes les données source soient présentes avant le début du traitement. Un message d’avertissement est généré dans le fichier VisualServer.log si des données supplémentaires sont reçues une fois les fichiers de sortie fermés. |
| Retraiter | Facultatif. N’importe quel caractère ou combinaison de caractères peut être saisi ici. La modification de ce paramètre et l’enregistrement du fichier sur la machine Transform lance le retraitement des données. Pour plus d’informations sur le retraitement de vos données, voir Retraitement et retransformation . |
| Phases | Facultatif. Les noms des étapes de traitement pouvant être utilisées dans le jeu de données de traitement du journal incluent les fichiers qui sont exécutés en plus du fichier Data Workbench Transform.cfg . Les étapes de traitement permettent d’organiser les transformations définies dans les fichiers Jeu de données de traitement du journal contenant les fichiers . Ce paramètre est très utile si vous avez défini une ou plusieurs transformations dans plusieurs fichiers Jeu de données de traitement du journal contenant et que vous souhaitez que des transformations spécifiques soient effectuées à des moments spécifiques pendant le processus d’exportation. L’ordre dans lequel vous listez les étapes détermine l’ordre dans lequel les transformations des fichiers Jeu de données de traitement du journal (y compris ) sont exécutées lors de l’exportation des données. Le prétraitement et le posttraitement sont des étapes intégrées ; Le prétraitement est toujours la première étape et le posttraitement est toujours la dernière étape. Par défaut, il existe une étape nommée Par défaut . Pour ajouter une nouvelle étape de traitement
Pour supprimer une étape de traitement existante
Remarque : Lorsque vous spécifiez une étape dans un fichier Jeu de données de traitement du journal Inclure , le nom de l’étape doit correspondre exactement au nom que vous saisissez ici. Pour plus d’informations sur les fichiers d’inclusion de jeux de données, voir Fichiers d’inclusion de jeux de données . |
| Heure de début | Facultatif. Filtrez les données pour inclure les entrées du journal avec horodatages à cette heure ou après cette heure. Adobe recommande d’utiliser l’un des formats suivants pour l’heure :
Par exemple, la spécification du 29 juillet 2013 00:00:00 EDT comme heure de début inclut des données à partir du 29 juillet 2013, à 12:00:00 AM EDT. Vous devez spécifier un fuseau horaire. Le fuseau horaire n’est pas défini par défaut sur GMT s’il n’est pas spécifié. Pour obtenir la liste des abréviations de fuseau horaire prises en charge par le serveur Data Workbench, voir Codes de fuseau horaire .
Remarque : Le paramètre Utiliser les heures de début et de fin pour les sources de fichiers journaux et Capteur est associé à ce paramètre. |
| Transformations | Facultatif. Définit les transformations à appliquer aux données. Pour plus d’informations sur les types de transformation disponibles, voir Transformations de données .
Remarque : Les types de transformation suivants ne fonctionnent pas lorsqu’ils sont définis dans le fichier Data Workbench Transform.cfg :
|
Si des données additionnelles sont reçues une fois les fichiers de sortie fermés (voir Log Sources et Offline Mode dans le tableau précédent), Transform crée de nouveaux fichiers de sortie avec les données additionnelles. Les noms des nouveaux fichiers de sortie sont générés à partir du nom du fichier de sortie d’origine avec l’ajout d’un numéro de version entre parenthèses juste avant l’extension. Par exemple, si le fichier de sortie d’origine est 20070701-ABC.vsl, les versions suivantes de ce fichier seront nommées 20070701-ABC(1).vsl, 20070701-ABC(2).vsl, etc. Notez que l’utilisation des fichiers versionnés en tant qu’entrée au serveur Data Workbench peut entraîner des erreurs de traitement.
Adobe recommande d’éviter la création de fichiers de sortie versionnés en s’assurant que toutes les données source sont dans l’ordre chronologique dans les fichiers d’entrée triés lexicographiquement et, si Offline Mode est défini sur true, que toutes les données source sont présentes avant le début du traitement. Pour plus d’informations, voir les entrées Log Sources et Offline Mode du tableau précédent.
Ajoutez des transformations en cliquant avec le bouton droit de la souris sur Transformations et en cliquant sur Add new > Transformation type. Renseignez les champs de transformation.
Voir Transformations de données pour obtenir des descriptions et des exemples des transformations que vous pouvez utiliser avec les fonctionnalités de transformation.
Cliquez avec le bouton droit de la souris sur (modified) en haut de la fenêtre, puis cliquez sur Save.
Pour que les modifications apportées localement prennent effet, dans la balise Profile Manager, cliquez avec le bouton droit de la souris sur la coche de Data Workbench Transform.cfg dans la colonne User, puis cliquez sur Save to > profile name, où le nom du profil est le nom du profil pour lequel vous exportez des données. Le retraitement des données commence après la synchronisation du profil.
Pour plus d’informations sur le retraitement de vos données à exporter, voir Retraitement et retransformation.