Définition des transformations Lookup

Informations sur les transformations que vous pouvez utiliser pour incorporer des données de recherche dans le jeu de données.

Notez que tous les types ne peuvent pas être utilisés pendant les deux phases du processus de construction du jeu de données.

Catégoriser

La transformation Categorize utilise une table de recherche à deux colonnes composée de paires modèle-chaîne/valeur. Au cours de cette transformation, le serveur de l’outil de données lit à son tour chaque enregistrement de données de événement et compare le contenu d’un champ désigné dans l’enregistrement à chacune des chaînes de modèle répertoriées dans la première colonne de la table de choix. Si le champ désigné correspond à l’une des chaînes de modèle, le serveur de l’outil de données écrit la valeur (figurant dans la deuxième colonne) associée à cette chaîne de modèle dans un champ de sortie désigné de l’enregistrement.

Les chaînes de la première colonne de la table de choix peuvent éventuellement s’début avec le caractère ^ et/ou se terminer dans le caractère $ pour forcer la correspondance au début et/ou à la fin. Cette transformation n’accepte pas les expressions régulières pour définir les conditions de correspondance dans la première colonne. Si la valeur d’entrée est un vecteur de chaînes, chaque chaîne est exécutée dans la transformation et le ou les résultats sont ajoutés à un vecteur de chaîne de sortie.

Une transformation Categorize est généralement plus facile et plus rapide que l'utilisation d'une transformation Regular Expression pour accomplir la même chose.

REMARQUE

Le test de sous-chaîne utilisé dans Categorize est sensible à la casse, sauf indication contraire à l'aide du paramètre Case Sensitive.

Paramètre Description Par défaut
Nom Nom descriptif de la transformation. Vous pouvez entrer n'importe quel nom ici.
Respect de la casse Vrai ou faux. Indique si le test de sous-chaîne est sensible à la casse. true
Commentaires Facultatif. Remarques sur la transformation.
Condition Conditions d'application de cette transformation.
Par défaut Valeur par défaut à utiliser si le test de condition réussit et qu’aucune entrée dans le fichier de catégorisation ne correspond à l’entrée ou si le champ d’entrée n’est pas défini dans l’entrée de journal donnée.
Délimiteur

Chaîne utilisée pour séparer les colonnes dans le fichier de recherche. Doit être un caractère de longueur unique.

Si vous maintenez la touche Ctrl enfoncée et cliquez avec le bouton droit dans le paramètre Délimiteur, un menu Insérer s'affiche. Ce menu contient une liste de caractères spéciaux qui sont souvent utilisés comme délimiteurs.

Valeurs multiples Vrai ou faux. Si la valeur est true, lorsque plusieurs lignes du fichier correspondent à l’entrée, chaque correspondance entraîne l’ajout d’une valeur au vecteur de sortie des chaînes. Si la valeur est false, seule la première ligne correspondante du fichier est utilisée dans la sortie. Dans ce dernier cas, si l’entrée est un vecteur, la sortie est également un vecteur de longueur équivalente. Si l’entrée est une chaîne simple, la sortie est également une chaîne simple. false
Fichier Chemin d’accès et nom de fichier du fichier de catégorisation. Les chemins relatifs concernent le répertoire d’installation du serveur de l’outil de données. Ce fichier se trouve généralement dans le répertoire Lookups du répertoire d’installation du serveur de l’outil de données.
Entrée Le fichier de catégorisation compare ses sous-chaînes à la valeur de ce champ pour identifier la ligne correspondante dans le fichier.
Sortie Nom du champ associé au résultat.

Considérations relatives à la catégorisation

  • Les modifications apportées aux fichiers de recherche dans les transformations Categorize définies dans le fichier Transformation.cfg ou dans un fichier Transformation Dataset Include nécessitent une retransformation du jeu de données. Les fichiers de recherche pour les transformations Categorize définies dans le fichier Log Processing.cfg ou un fichier Log Processing Dataset Include ne sont pas soumis à cette restriction. Pour plus d’informations sur le retraitement de vos données, voir Retraitement et retransformation.

  • Categorize les transformations définies dans le Log Processing.cfg fichier ou dans un Log Processing Dataset Include fichier rechargent leurs fichiers de recherche chaque fois que les fichiers de recherche changent. Les modifications ne sont pas appliquées rétroactivement, mais elles s’appliquent à toutes les données du journal lues après la modification.

Cet exemple illustre l'utilisation de la transformation Categorize pour intégrer les données de recherche aux données de événement collectées à partir du trafic du site Web. Supposons qu’un site Web particulier comporte des sections commerciales et qu’il soit nécessaire de pouvoir examiner et comparer les données en fonction du flux de trafic et de la valeur générés par les différentes sections. Vous pouvez créer un fichier de recherche qui liste les sous-chaînes utilisées pour identifier ces différentes sections.

Le fichier de recherche Lookups\custommap.txt contient le tableau suivant :

/products/ Produits
^/sports/ Sports
^/actualités/ News

Ce fichier de catégorisation fait correspondre tout ce qui contient la chaîne "/products/" à la valeur "Products", tout ce qui commence par "/sports/" à la valeur "Sports" et tout ce qui commence par "/news/" à la valeur "News". La transformation de catégorisation suivante utilise la valeur du champ cs-uri-stem comme chaîne dans laquelle nous recherchons une sous-chaîne correspondante. Le résultat de la transformation est placé dans le champ x-custommap.

En supposant que le paramètre Valeurs multiples soit défini sur false, l'exemple produirait les valeurs suivantes pour x-custommap en fonction des valeurs répertoriées pour cs-uri-stem.

cs-uri-stem x-custommap
/sports/news/today.php Sports
/sports/products/buy.php Produits
/news/headlines.php News
/news/products/subscribe.php Produits

La sortie est basée sur l’ordre des sous-chaînes dans le fichier de recherche. Par exemple, le cs-uri-stem /sports/products/buy.php renvoie "Products". Bien que la racine URI soit début avec "/sports/", la chaîne "/products/" est répertoriée avant "/sports/" dans le fichier de recherche. Si le paramètre Valeurs multiples était défini sur true, il y aurait une valeur supplémentaire pour x-custommap, car le dernier exemple correspondrait à deux lignes de la table de choix : Produits et actualités.

FlatFileLookup

La transformation FlatFileLookup utilise une table de choix composée de n'importe quel nombre de colonnes et de lignes (bien que, rappelez-vous qu'elle réside dans la mémoire). Au cours de ce type de transformation, le serveur de l’outil de données lit chaque enregistrement de données de événement à son tour et compare le contenu d’un champ désigné dans l’enregistrement à chacune des valeurs d’une colonne désignée de la table de choix. S’il existe une correspondance, le serveur de l’outil de données écrit une ou plusieurs valeurs de la ligne correspondante dans la table de recherche dans un ou plusieurs champs de sortie désignés dans l’enregistrement de données du événement.

La table de recherche utilisée pendant cette transformation est renseignée à partir d'un fichier plat dont vous spécifiez l'emplacement lorsque vous définissez la transformation.

Paramètre Description Par défaut
Nom Nom descriptif de la transformation. Vous pouvez entrer n'importe quel nom ici.
Commentaires Facultatif. Remarques sur la transformation.
Condition Conditions d'application de cette transformation.
Par défaut Valeur par défaut à utiliser si la condition est remplie et si aucune entrée dans le fichier de recherche ne correspond à l’entrée.
Délimiteur

Chaîne utilisée pour séparer les colonnes dans le fichier de recherche. Doit être un caractère de longueur unique.

Si vous maintenez la touche Ctrl enfoncée et cliquez avec le bouton droit dans le paramètre Délimiteur, un menu Insérer s'affiche. Ce menu contient une liste de caractères spéciaux qui sont souvent utilisés comme délimiteurs.

Fichier Chemin d’accès et nom de fichier du fichier de recherche. Les chemins relatifs concernent le répertoire d’installation du serveur de l’outil de données. Ce fichier se trouve généralement dans le répertoire Lookups du répertoire d’installation du serveur de l’outil de données.
Rangée d’en-tête Vrai ou faux. Indique que la première rangée du tableau est une rangée d’en-tête à ignorer lors du traitement.
Entrée Nom de colonne est le nom de la colonne utilisée pour faire correspondre l'entrée aux lignes du fichier. Si la valeur Rangée d’en-tête est true, il peut s’agir du nom d’une colonne dans le fichier de recherche. Dans le cas contraire, il doit s’agir du numéro de colonne de base zéro pour lequel une correspondance doit être établie. Nom de champ est le nom du champ utilisé pour localiser la ligne dans le fichier de recherche.
Valeurs multiples

Vrai ou faux. Détermine si une seule valeur (une ligne correspondante) ou plusieurs valeurs doivent être renvoyées (une pour chaque ligne correspondante).

Remarque : Si plusieurs valeurs est défini sur false, vous devez vous assurer qu’il n’y a pas plusieurs correspondances. Lorsque plusieurs correspondances se produisent, il n'y a aucune garantie quant à la correspondance qui sera renvoyée.

Sorties

Vecteur d’objets de colonne (résultats) dans lequel chaque objet est défini par les noms de colonne et de champ.

Le nom de colonne est la colonne à partir de laquelle la valeur de sortie est obtenue. Si Rangée d’en-tête est vraie, il peut s’agir du nom d’une colonne dans le fichier de recherche. Dans le cas contraire, il doit s’agir du numéro de colonne de base zéro pour lequel une correspondance doit être établie.

Nom de champ est le nom du champ utilisé pour capturer la sortie. Notez qu’il peut s’agir d’un vecteur de résultats, un pour chaque ligne identifiée dans le cas où le paramètre Valeurs multiples a la valeur true.

Considérations relatives auxFlatFileLookup

  • La correspondance du champ d’entrée au fichier de recherche est toujours sensible à la casse.

  • Les modifications apportées aux fichiers de recherche dans les transformations FlatFileLookup définies dans le fichier Transformation.cfg ou les fichiers Transformation Dataset Include nécessitent une retransformation du jeu de données. Les fichiers de recherche pour les transformations FlatFileLookup définies dans le fichier Log Processing.cfg ou les fichiers Log Processing Dataset Include ne sont pas soumis à cette restriction. Pour plus d’informations sur le retraitement de vos données, voir Retraitement et retransformation.

  • FlatFileLookup dans le Log Processing.cfg fichier ou les Log Processing Dataset Include fichiers rechargent leurs fichiers de recherche chaque fois que les fichiers de recherche changent. Les modifications ne sont pas appliquées rétroactivement, mais elles s’appliquent à toutes les données du journal lues après la modification.

Cet exemple illustre l'utilisation de la transformation FlatFileLookup pour intégrer les données de recherche aux données de événement collectées à partir du trafic du site Web. Supposons que vous souhaitiez isoler les partenaires du site Web qui transforment le trafic du routage vers le site Web et transformer leurs identifiants de partenaire en noms plus conviviaux. Vous pouvez ensuite utiliser les noms conviviaux pour créer des dimensions et des visualisations étendues qui correspondent plus clairement à la relation d’affaires que la relation site à site utilisée pour le trafic de routage.

L'exemple de transformation recherche la paire nom-valeur dans le champ cs(parrain-requête) de l'ID de partenaire et, s'il se trouve, le fichier de recherche Lookups\partners.txt est utilisé pour comparer la valeur de l'ID de partenaire aux valeurs de la colonne Partner de la table. Si une ligne est située, le champ de sortie x-partner-name reçoit le nom de la colonne PrintName de la ligne identifiée.

Si la table de choix contenait les informations suivantes :

ID Partenaire Démarré PrintName
1 P154 21 août 1999 Yahoo
2 P232 10 juillet 2000 Microsoft
3 P945 12 janvier 2001 Amazon

Les exemples suivants se transformeraient comme suit :

  • Si cs(parrain)(PartnerID) renvoie P232, le champ x-partner-name reçoit la valeur "Microsoft".
  • Si cs(parrain)(PartnerID) renvoie P100, le champ x-partner-name reçoit la valeur "No Partner".
  • Si cs(parrain)(PartnerID) ne renvoyait rien, le champ x-partner-name recevrait la valeur "Aucun partenaire" spécifiée par le paramètre par défaut.

ODBCLookup

La transformation ODBCLookup fonctionne comme une transformation FlatFileLookup. La seule différence est que la table de recherche utilisée pendant cette transformation est renseignée à partir d'une base de données ODBC et non d'un fichier plat.

REMARQUE

ODBCLookup les transformations ne peuvent être exécutées que pendant la phase de transformation du processus de construction des ensembles de données. Dans la mesure du possible, l'Adobe vous recommande d'utiliser la transformation FlatFileLookup au lieu de la transformation ODBCLookup. FlatFileLookup les transformations sont intrinsèquement plus fiables parce qu'elles ne dépendent pas de la disponibilité d'un système externe. De plus, il y a moins de risque que la table de recherche soit modifiée si elle réside dans un fichier plat que vous contrôlez localement.

Paramètre Description Par défaut
Nom Nom descriptif de la transformation. Vous pouvez entrer n'importe quel nom ici.
Commentaires Facultatif. Remarques sur la transformation.
Condition Conditions d'application de cette transformation.
Nom de la source de données Un DSN, fourni par un administrateur de l'ordinateur serveur de l'outil de données sur lequel le jeu de données est traité, qui fait référence à la base de données à partir de laquelle les données doivent être chargées.
Mot de passe de base de données mot de passe à utiliser lors de la connexion à la base de données. Si un mot de passe a été configuré pour le DSN dans l' Administrateur de source de données, il peut rester vide. Tout mot de passe fourni ici remplace le mot de passe configuré pour le DSN dans l' Administrateur de source de données.
ID utilisateur de base de données ID utilisateur à utiliser lors de la connexion à la base de données. Si un ID utilisateur a été configuré pour le DSN dans l' Administrateur de la source de données, il peut rester vide. Tout ID utilisateur fourni ici remplace l’ID utilisateur configuré pour le DSN dans l’ Administrateur de source de données.
Par défaut Valeur par défaut à utiliser si la condition est remplie et qu’aucune entrée dans le fichier de recherche ne correspond à l’entrée.
Colonne d’entrée Le nom de colonne est le nom de colonne ou l'expression SQL des données qui correspondent à l'entrée. Nom du champ est le nom du champ contenant les données à rechercher.
Valeurs multiples

Vrai ou faux. Détermine si une seule valeur (une ligne correspondante) ou plusieurs valeurs doivent être renvoyées (une pour chaque ligne correspondante).

Remarque : Si plusieurs valeurs est défini sur false, vous devez vous assurer qu’il n’y a pas plusieurs correspondances. Lorsque plusieurs correspondances se produisent, il n'y a aucune garantie quant à la correspondance qui sera renvoyée.

Colonnes de sortie

Vecteur d’objets de colonne (résultats) où chaque objet est défini par les noms de colonne et de champ.

Le nom de colonne est le nom ou l'expression SQL de la colonne à partir de laquelle la valeur de sortie est obtenue. Nom de champ est le nom du champ utilisé pour capturer la sortie.

Identifiant de table Expression SQL qui nomme la table ou la vue à partir de laquelle les données doivent être chargées. Un identifiant de tableau type est le SCHÉMA.TABLE.
  • Les paramètres Nom de la source de données, Database User ID, Database Password et Identificateur de table sont identiques aux paramètres des mêmes noms décrits pour les sources de données ODBC. Voir Sources de données ODBC.

  • Contrairement aux sources de données ODBC, les transformations ODBCLookup ne nécessitent pas une colonne d'ID croissante. Voir Sources de données ODBC. Cela est dû au fait que le contenu de la table de choix ne doit en aucun cas changer tant que le jeu de données est principal. Les modifications d’une table de choix ou d’une vue ne peuvent pas être détectées tant que la transformation n’a pas eu lieu. Pour plus d’informations sur le retraitement de vos données, voir Retraitement et retransformation.

Supposons que vous souhaitiez convertir des enregistrements DNS obsolètes en enregistrements mis à jour. Les deux jeux d'enregistrements sont stockés dans une base de données SQL. Pour effectuer cette tâche, vous référenceriez une table de recherche générée à partir de la base de données et remplacerez les enregistrements DNS obsolètes.

Notre exemple de transformation recherche le champ s-dns dans les entrées du journal et, s'il se trouve, la table de recherche VISUAL.LOOKUP est utilisée pour comparer l'entrée s-dns aux entrées de la colonne OLDDNS de la table. Si une ligne se trouve dans la table, le champ de sortie s-dns reçoit l'entrée d'enregistrement DNS mise à jour de la colonne NEWDNS de la ligne identifiée.

Sur cette page

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now