Groupes de décodeur de fichier texte

Le traitement des fichiers journaux en tant que sources de journaux nécessite la définition d’un décodeur dans le fichier d’inclusion du jeu de données de traitement du journal pour extraire les champs de données des entrées de journal.

La définition de groupes de décodeur de fichier texte pour les sources de journaux de fichiers journaux nécessite une connaissance de la structure et du contenu du fichier journal, des données à extraire et des champs dans lesquels ces données sont stockées. Cette section fournit des descriptions de base des paramètres que vous pouvez spécifier pour les décodeurs, mais la manière dont vous utilisez un décodeur dépend du fichier journal contenant les données source.

Pour plus d’informations sur les exigences de format des sources de journaux de fichiers journaux, voir Fichiers journaux. Pour obtenir de l’aide sur la définition des décodeurs de fichiers texte, contactez Adobe.

Un groupe de décodeur de fichier texte peut inclure :

Décodeurs d’expression régulière

Un décodeur d’expression régulière identifie les modèles de chaîne complexes dans les entrées de journal d’un fichier journal et extrait ces modèles en tant que champs de données. Pour chaque décodeur, le nombre de champs doit être égal au nombre de sous-modèles capturés dans l’expression régulière. La partie de la ligne correspondant au sous-modèle de capture nth est affectée au énième champ de cette ligne.

Pour ajouter un décodeur d’expression régulière à un groupe de décodeur de fichier texte

  1. Ouvrez le fichier Log Processing Dataset Include comme décrit dans la section Modification des fichiers d’inclusion de jeux de données existants et ajoutez un groupe de décodeur de fichier texte. Voir l’entrée de tableau Groupes de décodeur.

  2. Cliquez avec le bouton droit de la souris sur Decoders sous le groupe de décodeur nouvellement créé, puis cliquez sur Add new > Regular Expression.

  3. Indiquez les informations suivantes :

    • Champs : liste des champs du fichier journal. Si l’un des champs définis ici doit être transmis à la phase de transformation de la construction du jeu de données, ces champs doivent être répertoriés dans le paramètre Champs de l’un des fichiers Log Processing Dataset Include du jeu de données. Les noms de champ personnalisés doivent commencer par "x-".

    • Nom : identificateur facultatif pour le décodeur.

    • Expression régulière : permet d’extraire les champs de votre choix à partir de chaque ligne du fichier.

  4. Répétez les étapes 4 et 5 pour tout autre décodeur à ajouter au groupe.

  5. Pour enregistrer le fichier Log Processing Dataset Include, cliquez avec le bouton droit de la souris sur (modified) en haut de la fenêtre, puis cliquez sur Save.

  6. Pour que les modifications apportées localement prennent effet, dans la balise Profile Manager, cliquez avec le bouton droit de la souris sur la coche du fichier dans la colonne User. Cliquez sur Save to > <profile name, où le nom du profil correspond au nom du profil du jeu de données ou du profil hérité auquel appartient le fichier d’inclusion du jeu de données.

N'enregistrez le fichier de configuration modifié dans aucun des profils internes fournis par Adobe, car vos modifications sont écrasées lorsque vous installez des mises à jour sur ces profils.

REMARQUE

Un fichier journal donné peut comporter plusieurs décodeurs d’expression régulière. L’ordre dans lequel vous définissez les décodeurs est important : le premier décodeur qui correspond à une ligne du fichier journal est celui utilisé pour décoder cette ligne.

Cet exemple illustre l’utilisation d’un décodeur d’expression régulière pour extraire des champs de données d’un fichier texte délimité par des tabulations. Vous pouvez obtenir le même résultat en définissant un décodeur délimité avec un délimiteur de tabulation.

Pour plus d’informations sur les décodeurs d’expression régulière, y compris la terminologie et la syntaxe, voir Expressions régulières.

Décodeurs délimités

Un décodeur délimité décode un fichier journal dont les champs sont délimités par un seul caractère. Le nombre de champs doit correspondre au nombre de colonnes dans le fichier délimité ; toutefois, tous les champs n’ont pas besoin d’être nommés. Si un champ n’est pas renseigné, la colonne est toujours requise dans le fichier journal, mais le décodeur l’ignore.

Pour ajouter un décodeur délimité à un groupe de décodeur de fichier texte

  1. Ouvrez le fichier Log Processing Dataset Include comme décrit dans la section Modification des fichiers d’inclusion de jeux de données existants et ajoutez un groupe de décodeur de fichier texte. Voir l’entrée de tableau Groupes de décodeur.

  2. Cliquez avec le bouton droit de la souris sur Decoders sous le groupe de décodeur nouvellement créé, puis cliquez sur Add new > Delimited.

  3. Indiquez les informations suivantes :

    • Champs : liste des champs du fichier journal. Si l’un des champs définis ici doit être transmis à la phase de transformation de la construction du jeu de données, ces champs doivent être répertoriés dans le paramètre Champs de l’un des fichiers Log Processing Dataset Include du jeu de données. Les noms de champ personnalisés doivent commencer par "x-".

    • Délimiteur : caractère utilisé pour séparer les champs dans le fichier de sortie.

  4. Répétez les étapes 4 et 5 pour tout autre décodeur à ajouter au groupe.

  5. Pour enregistrer le fichier Log Processing Dataset Include, cliquez avec le bouton droit de la souris sur (modified) en haut de la fenêtre, puis cliquez sur Save.

  6. Pour que les modifications apportées localement prennent effet, dans la balise Profile Manager, cliquez avec le bouton droit de la souris sur la coche du fichier dans la colonne User, puis cliquez sur Save to <profile name, où le nom du profil correspond au nom du profil du jeu de données ou au profil hérité auquel appartient le fichier d’inclusion du jeu de données.

REMARQUE

N'enregistrez le fichier de configuration modifié dans aucun des profils internes fournis par Adobe, car vos modifications sont écrasées lorsque vous installez des mises à jour sur ces profils.

Cet exemple illustre l’utilisation d’un décodeur délimité pour extraire des champs de données d’un fichier texte délimité par des virgules contenant des données relatives aux films.

Sur cette page