CrossRows

Comme d'autres transformations, la transformation CrossRows est appliquée aux lignes de données (entrées de journal) de vos sources de journaux.

Pour chaque ligne de données, la transformation prend la valeur du champ d’entrée spécifié, effectue un ensemble d’étapes de traitement et enregistre le résultat dans le champ de sortie que vous spécifiez. Cependant, lorsque la transformation CrossRows fonctionne sur une ligne de données (cette ligne est appelée la ligne de sortie), elle prend en compte cette ligne plus une ou plusieurs autres lignes de données (ces lignes sont appelées lignes d'entrée) qui sont associées au même ID de suivi. Par conséquent, pour un ID de suivi donné, la valeur du champ de sortie pour chaque ligne de sortie est basée sur les valeurs du champ d’entrée pour une ou plusieurs lignes d’entrée.

La transformation fournit plusieurs conditions et contraintes qui vous permettent de limiter les lignes d’entrée pour la transformation. Vous pouvez exprimer ces limites en fonction des conditions du serveur de l'outil de données (voir Conditions), d'une plage de lignes d'entrée par rapport à la ligne de sortie ou d'une plage de fois par rapport à l'heure de la ligne de sortie. Pour les lignes d'entrée qui répondent aux conditions et contraintes de la transformation, vous pouvez appliquer une opération (telle que SUM) qui détermine la valeur du champ de sortie.

REMARQUE

Pour fonctionner, la transformation CrossRows requiert que les données soient triées dans le temps et regroupées par ID de suivi dans vos données source. Par conséquent, CrossRows ne fonctionne que lorsqu'il est défini dans le fichier Transformation.cfg ou dans un fichier Transformation Dataset Include.

Lorsque vous passez en revue les descriptions des paramètres du tableau suivant, tenez compte des points suivants :

  • La ligne de sortie correspond à la ligne de données sur laquelle la transformation travaille à un moment donné.
  • Les lignes d’entrée sont toutes les autres lignes de données (avant, après ou incluant la ligne de sortie) dont les valeurs du champ d’entrée servent d’entrées à la transformation. Les lignes d’entrée sont soumises aux paramètres Condition d’entrée, Clé, Début de la ligne, Fin de la ligne, Début de l’heure et Fin de l’heure.
Paramètre Description Par défaut
Nom Nom descriptif de la transformation. Vous pouvez entrer n'importe quel nom ici.
Commentaires Facultatif. Remarques sur la transformation.
Condition Limite la sortie de la transformation à certaines entrées de journal. Si la condition n’est pas remplie pour une entrée de journal particulière, le champ du paramètre Output reste inchangé. L'entrée peut toujours être utilisée pour affecter d'autres entrées de journal.
Entrée Nom du champ de la ligne d’entrée à utiliser comme entrée.
Condition d’entrée Accepte l’entrée pour la transformation à partir de certaines lignes d’entrée seulement. Si la condition d’entrée n’est pas remplie pour une ligne d’entrée particulière, le champ d’entrée de cette ligne est ignoré et n’affecte pas les autres lignes de sortie. Cependant, le champ de sortie de cette ligne est toujours modifié selon la condition spécifiée.
Clé

Facultatif. Nom du champ à utiliser comme clé.

Si une clé est spécifiée, les lignes d’entrée d’une ligne de sortie donnée sont limitées au bloc contigu de lignes ayant la même valeur de clé que la ligne de sortie. Cette restriction vient s'ajouter à toutes les autres limites imposées aux lignes d'entrée par d'autres paramètres de la transformation CrossRows.

Par exemple, si vous travaillez avec des données Web et que vous définissez le champ x-session-key (qui a une valeur unique pour chaque session) comme clé, les lignes d’entrée pour la transformation sont limitées aux lignes ayant la même valeur x-session-key que la ligne de sortie. Par conséquent, vous ne tenez compte que des lignes d’entrée représentant les vues de page qui se produisent au cours de la même session que la ligne de sortie.

Opération

Opération qui, pour chaque ligne de sortie, est appliquée à toutes les lignes d’entrée satisfaisant à toutes les conditions définies par les paramètres Condition d’entrée, Clé, Début de ligne, Fin de ligne, Début de ligne et Fin de temps pour produire une sortie :

  • ALL prend toutes les valeurs du champ d’entrée à partir des lignes d’entrée et les génère sous forme de vecteur.
  • SUM interprète les valeurs du champ d’entrée des lignes d’entrée comme des nombres et les additionne.
  • PREMIÈRE LIGNE génère la valeur du champ d’entrée à partir de la première ligne d’entrée.
  • LAST ROW génère la valeur du champ d’entrée à partir de la dernière ligne d’entrée.

Sortie Nom du champ de sortie.
Début de ligne/Fin de ligne

Facultatif. Indique une plage de lignes d’entrée par rapport à la ligne de sortie. Par exemple, une valeur de début de ligne de "0" exclut toutes les lignes antérieures à la ligne de sortie. La valeur de début de ligne "1" exclut également la ligne de sortie. Les plages courantes sont les suivantes :

  • Début 0 : Cette ligne et toutes les lignes suivantes.
  • Début 1 : Toutes les lignes suivantes.
  • Fin 0 : Cette ligne et toutes les précédentes.
  • Fin -1 : Toutes les lignes précédentes.
  • Début -1, Fin -1 : Ligne précédente.
  • Début 1, Fin 1 : Ligne suivante.

Toutes les lignes
Début/Fin de l’heure

Facultatif. Indique une plage de temps par rapport à l’heure de la ligne de sortie. Par exemple, une fin de temps de 30 minutes comprend toutes les lignes qui se produisent dans les 30 minutes suivant la ligne de sortie. Un début d’heure de -30 minutes comprend toutes les lignes qui se produisent dans les 30 minutes précédant la ligne de sortie.

Les unités de temps disponibles sont les jours, les semaines, les heures, les minutes, les ms (millisecondes), les tiques (100 nanosecondes) et les ns (nanosecondes).

Toutes les heures

La transformation CrossRows de cet exemple est appliquée aux lignes de données Web afin de rechercher pour chaque vue de page l’heure de la vue de page suivante. Comme nous savons que CrossRows n'est appliqué qu'au cours de la phase de transformation du processus de construction du jeu de données, les lignes de données sont triées par visiteur (chaque visiteur possède un identifiant de suivi unique) et par heure.

Le champ d’entrée, l’horodatage x, n’est pris en compte que pour les lignes d’entrée dans lesquelles le champ x-is-page-vue est renseigné (indiquant que la ligne de données représente une vue de page). Le champ x-session-key (qui a une valeur unique pour chaque session) est spécifié pour le paramètre Key. Par conséquent, les lignes d’entrée (entrées de journal) pour la transformation sont limitées au bloc contigu de lignes ayant la même valeur de x-session-key que la ligne de sortie. En d’autres termes, pour que la transformation soit prise en compte, une ligne d’entrée doit représenter une vue de page qui se produit au cours de la même session que la vue de page dans la ligne de sortie. La première opération de ligne prend la valeur du champ de sortie à partir de la première ligne d'entrée correspondant à la condition Input et ayant la même valeur x-session-key que la ligne de sortie.

CrossRows s’exécute dans un laps de temps proportionnel à la taille de ses entrées plus la taille de ses sorties. Cela signifie que pour les opérations SUM, PREMIÈRE RANGÉE et DERNIÈRE RANGÉE, elle n'est pas moins efficace que les autres transformations. Pour ALL, la situation est plus complexe car il est possible de configurer CrossRows pour générer une quantité de données pour chaque ligne de données (entrée de journal) proportionnelle au nombre total de lignes (entrées de journal) pour un ID de suivi donné.

Sur cette page

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now