Groupement basé sur les champs
Dans l’assemblage basé sur les champs, vous spécifiez un jeu de données d’événement ainsi que l’identifiant persistant (cookie) et l’identifiant temporaire (ID de personne) pour ce jeu de données. L’assemblage basé sur les champs crée une colonne d’ID assemblé dans le nouveau jeu de données assemblé et met à jour cette colonne d’ID assemblé en fonction des lignes qui ont un ID transitoire pour cet ID persistant spécifique.
Vous pouvez utiliser l’assemblage basé sur les champs lors de l’utilisation de Customer Journey Analytics en tant que solution autonome (vous n’avez pas accès au service d’identités Experience Platform et au graphique d’identités associé). Ou, lorsque vous ne souhaitez pas utiliser le graphique d’identité disponible.
IdentityMap
L’assemblage basé sur les champs prend en charge l’utilisation du groupe de champs identityMap
dans les scénarios suivants :
-
Utilisation de l’identité principale dans les espaces de noms d’
identityMap
pour définir l’ID persistant :- Si plusieurs identités principales sont trouvées dans différents espaces de noms, les identités des espaces de noms sont triées par ordre lexigraphique et la première identité est sélectionnée.
- Si plusieurs identités principales sont trouvées dans un seul espace de noms, la première identité principale disponible au niveau lexicographique est sélectionnée.
Dans l’exemple ci-dessous, les espaces de noms et les identités génèrent une liste d’identités principales triées, et finalement l’identité sélectionnée.
table 0-row-2 1-row-2 2-row-2 layout-auto html-authored Espaces de noms Liste des identités ECID code language-none [ {"id": "ecid-3"}, {"id": "ecid-2", "primary": true}, {"id": "ecid-1", "primary": true} ]
CCID code language-none [ {"id": "ccid-1"}, {"id": "ccid-2", "primary": true} ]
table 0-row-2 1-row-2 layout-auto html-authored Liste des identités triées Identité sélectionnée code language-none PrimaryIdentities [ {"id": "ccid-2", "namespace": "CCID"}, {"id": "ecid-1", "namespace": "ECID"}, {"id": "ecid-2", "namespace": "ECID"} ] NonPrimaryIdentities [ {"id": "ccid-1", "namespace": "CCID"}, {"id": "ecid-3", "namespace": "ECID"} ]
code language-none "id": "ccid-2", "namespace": "CCID"
-
Utilisation de
identityMap
’espace de noms pour définir persistentID ou transientID, ou les deux :- Si plusieurs valeurs pour persistentID ou transientID sont trouvées dans un espace de noms
identityMap
, la première valeur disponible lexicographique est utilisée. - Les espaces de noms pour persistentID et transientID doivent s’exclure mutuellement.
Dans l’exemple ci-dessous, vous avez sélectionné ECID comme espace de noms à utiliser. Cette sélection entraîne une liste d’identités triées, et finalement l’identité sélectionnée.
table 0-row-2 1-row-2 2-row-2 layout-auto html-authored Espaces de noms Liste des identités ECID code language-none [ {"id": "ecid-3"}, {"id": "ecid-2", "primary": true}, {"id": "ecid-1", "primary": true} ]
CCID code language-none [ {"id": "ccid-1"}, {"id": "ccid-2", "primary": true} ]
table 0-row-2 1-row-2 layout-auto html-authored Liste des identités triées Identité sélectionnée code language-none [ "id": "ecid-1", "id": "ecid-2", "id": "ecid-3" ]
code language-none "id": "ecid-1", "namespace": "ECID"
- Si plusieurs valeurs pour persistentID ou transientID sont trouvées dans un espace de noms
Fonctionnement de l’assemblage basé sur les champs
L’assemblage effectue au moins deux passages aux données d’un jeu de données donné.
-
Assemblage en direct : tente d’assembler chaque accès (événement) au fur et à mesure qu’il arrive. Les accès provenant d’appareils qui sont « nouveaux » dans le jeu de données (ne se sont jamais authentifiés) ne sont généralement pas regroupés à ce niveau. Les accès provenant d’appareils déjà reconnus sont immédiatement regroupés.
-
Groupement des relectures : relit les données en fonction des identifiants uniques (ID transitoires) qu’il a appris. C’est à cette étape que les accès provenant d’appareils inconnus précédemment (identifiants persistants) sont regroupés (en identifiants transitoires). La relecture est déterminée par deux paramètres : fréquence et intervalle de recherche en amont. Adobe propose les combinaisons de paramètres suivantes :
- Recherche en amont quotidienne à une fréquence quotidienne : les données sont relues tous les jours avec un intervalle de recherche en amont de 24 heures. Cette option présente un avantage car les relectures sont beaucoup plus fréquentes, mais les visiteurs non authentifiés doivent s’authentifier le jour même où ils visitent votre site.
- Recherche en amont hebdomadaire à une fréquence hebdomadaire : les données sont relues une fois par semaine avec un intervalle de recherche en amont hebdomadaire (voir options). Cette option présente un avantage qui permet aux sessions non authentifiées de disposer d’un temps d’authentification beaucoup moins stricte. Toutefois, les données désassemblées datant de moins d’une semaine ne sont pas retraitées avant la prochaine relecture hebdomadaire.
- Recherche en amont bihebdomadaire sur une fréquence hebdomadaire : les données sont relues une fois par semaine avec un intervalle de recherche en amont bihebdomadaire (voir options). Cette option présente un avantage qui permet aux sessions non authentifiées de disposer d’un temps d’authentification beaucoup moins stricte. Toutefois, les données désassemblées datant de moins de deux semaines ne sont pas retraitées avant la prochaine relecture hebdomadaire.
- Recherche en amont mensuelle à une fréquence hebdomadaire : les données sont relues chaque semaine avec un intervalle de recherche en amont mensuel (voir options). Cette option présente un avantage qui permet aux sessions non authentifiées de disposer d’un temps d’authentification beaucoup moins stricte. Toutefois, les données désassemblées datant de moins d’un mois ne sont pas retraitées avant la prochaine relecture hebdomadaire.
-
Confidentialité : lorsque des demandes liées à la confidentialité sont reçues, en plus de supprimer l’identité demandée, tout regroupement de cette identité entre des événements non authentifiés doit être annulé.
note important IMPORTANT Le processus de désassemblage, dans le cadre des demandes d’accès à des informations personnelles, change début 2025. Le processus de désassemblage actuel réassemble les événements à l’aide de la dernière version des identités connues. Cette réaffectation d'événements à une autre identité pourrait avoir des conséquences juridiques indésirables. Pour résoudre ces problèmes, à partir de 2025, le nouveau processus d’assemblage met à jour les événements qui font l’objet de la demande d’accès à des informations personnelles avec l’identifiant persistant.
Les données au-delà de l’intervalle de recherche en amont ne sont pas relues. Un visiteur doit s’authentifier dans un intervalle de recherche en amont donné pour qu’une visite non authentifiée et une visite authentifiée soient identifiées ensemble. Une fois qu’un appareil est reconnu, il est assemblé en direct à partir de ce moment.
Étape 1 : Assemblage dynamique
L’assemblage en direct tente d’assembler chaque événement lors de la collecte sur des appareils et des canaux connus.
Prenons l’exemple suivant, où Robert enregistre différents événements dans le cadre d’un jeu de données d’événement.
Données telles qu’elles s’affichaient le jour de leur collecte :
table 0-row-5 1-row-5 2-row-5 3-row-5 4-row-5 5-row-5 6-row-5 7-row-5 8-row-5 9-row-5 10-row-5 11-row-5 12-row-5 13-row-5 | ||||
---|---|---|---|---|
Événement | Date et heure | ID persistant (ID de cookie) | ID temporaire (ID de connexion) | ID groupé (après le groupement dynamique) |
1 | 12/05/2023 12:01 | 246
|
- | 246 |
2 | 12/05/2023 12:02 | 246 |
Bob
|
Bob |
3 | 12/05/2023 12:03 | 246 |
Bob
|
Bob
|
4 | 12/05/2023 12:04 | 246 |
- | Bob |
5 | 12/05/2023 12:05 | 246 |
Bob
|
Bob
|
6 | 12/05/2023 12:06 | 246 |
- | Bob |
7 | 12/05/2023 12:07 | 246 |
Bob
|
Bob |
8 | 12/05/2023 12:03 | 3579
|
- | 3579 |
9 | 12/05/2023 12:09 | 3579
|
- | 3579 |
10 | 12/05/2023 12:02 | 81911
|
- | 81911 |
11 | 12/05/2023 12:05 | 81911 |
Bob
|
Bob
|
12 | 12/05/2023 12:12 | 81911 |
- | Bob |
appareils 3 | 4 personnes:246 , Bob , 3579 , 81911 |
Les accès authentifiés et non authentifiés sur les nouveaux appareils sont (temporairement) comptabilisés comme des personnes distinctes. Les événements non authentifiés sur les appareils reconnus sont assemblés en direct.
L’attribution fonctionne lorsque la variable personnalisée d’identification est liée à un appareil. Dans l’exemple ci-dessus, tous les événements, à l’exception des événements 1, 8, 9 et 10, sont assemblés en direct (ils utilisent tous l’identifiant Bob
). L’assemblage en direct « résout » l’identifiant assemblé pour les événements 4, 6 et 12.
Les données différées (données dont l’horodatage date de plus de 24 heures) sont traitées selon le principe du « meilleur effort », tout en donnant la priorité à l’assemblage des données actuelles pour une qualité maximale.
Étape 2 : assemblage de lectures
À intervalles réguliers (une fois par semaine ou une fois par jour, selon l’intervalle de recherche en amont choisi), le groupement de relecture recalcule les données historiques en fonction des appareils qu’il reconnaît désormais. Si un appareil envoie initialement des données alors qu’il n’est pas authentifié, puis se connecte, le groupement de relecture lie ces événements non authentifiés à la bonne personne.
Le tableau suivant représente les mêmes données que ci-dessus, mais affiche des nombres différents à cause de la relecture des données.
Les mêmes données après relecture :
table 0-row-6 1-row-6 2-row-6 3-row-6 4-row-6 5-row-6 6-row-6 7-row-6 8-row-6 9-row-6 10-row-6 11-row-6 12-row-6 13-row-6 layout-auto | |||||
---|---|---|---|---|---|
Événement | Date et heure | ID persistant (ID de cookie) | ID temporaire (ID de connexion) | ID groupé (après le groupement dynamique) | ID groupé (après relecture) |
1 | 12/05/2023 12:01 | 246 |
- | 246 |
Bob |
2 | 12/05/2023 12:02 | 246 |
Bob
|
Bob |
Bob
|
3 | 12/05/2023 12:03 | 246 |
Bob
|
Bob
|
Bob |
4 | 12/05/2023 12:04 | 246 |
- | Bob |
Bob |
5 | 12/05/2023 12:05 | 246 |
Bob
|
Bob
|
Bob |
6 | 12/05/2023 12:06 | 246 |
- | Bob |
Bob |
7 | 12/05/2023 12:07 | 246 |
Bob
|
Bob |
Bob |
8 | 12/05/2023 12:03 | 3579
|
- | 3579 |
3579 |
9 | 12/05/2023 12:09 | 3579
|
- | 3579 |
3579 |
10 | 12/05/2023 12:02 | 81911 |
- | 81911 |
Bob |
11 | 12/05/2023 12:05 | 81911 |
Bob
|
Bob
|
Bob
|
12 | 12/05/2023 12:12 | 81911 |
- | Bob |
Bob |
appareils 3 | 4 personnes:246 , Bob , 3579 , 81911 |
2 personnes:Bob , 3579 |
L’attribution fonctionne lorsque la variable personnalisée d’identification est liée à un appareil. Dans l’exemple ci-dessus, les événements 1 et 10 sont assemblés à la suite de la relecture, laissant uniquement les événements 8 et 9 désassemblés. Et réduire la mesure Personnes (cumulative) à 2.
Étape 3 : demande d'accès à des informations personnelles
Lorsque vous recevez une demande d’accès à des informations personnelles, l’ID regroupé est supprimé dans tous les enregistrements pour l’utilisateur faisant l’objet de la demande d’accès à des informations personnelles.
Le tableau suivant représente les mêmes données que ci-dessus, mais montre l’effet d’une demande d’accès à des informations personnelles pour Bob sur les données après leur traitement. Les lignes où Bob est authentifié sont supprimées (2, 3, 5, 7 et 11) ainsi que la suppression de Bob en tant qu’ID temporaire pour d’autres lignes.
Les mêmes données après une demande d’accès à des informations personnelles pour Bob :
table 0-row-8 1-row-8 2-row-8 3-row-8 4-row-8 5-row-8 6-row-8 7-row-8 8-row-8 9-row-8 10-row-8 11-row-8 12-row-8 13-row-8 | |||||||
---|---|---|---|---|---|---|---|
Événement | Date et heure | ID persistant (ID de cookie) | ID temporaire (ID de connexion) | ID groupé (après le groupement dynamique) | ID groupé (après relecture) | ID temporaire (ID de connexion) | ID groupé (après demande d’accès à des informations personnelles) |
1 | 12/05/2023 12:01 | 246 |
- | 246 |
Bob |
- | 246 |
2 | 12/05/2023 12:02 | 246 |
Bob
|
Bob |
Bob
|
|
246 |
3 | 12/05/2023 12:03 | 246 |
Bob
|
Bob
|
Bob |
|
246 |
4 | 12/05/2023 12:04 | 246 |
- | Bob |
Bob |
- | 246 |
5 | 12/05/2023 12:05 | 246 |
Bob
|
Bob
|
Bob |
|
246 |
6 | 12/05/2023 12:06 | 246 |
- | Bob |
Bob |
- | 246 |
7 | 12/05/2023 12:07 | 246 |
Bob
|
Bob |
Bob |
|
246 |
8 | 12/05/2023 12:03 | 3579
|
- | 3579 |
3579 |
- | 3579 |
9 | 12/05/2023 12:09 | 3579
|
- | 3579 |
3579 |
- | 3579 |
10 | 12/05/2023 12:02 | 81911 |
- | 81911 |
Bob |
- | 81911 |
11 | 12/05/2023 12:05 | 81911 |
Bob
|
Bob
|
Bob
|
|
81911 |
12 | 12/05/2023 12:12 | 81911 |
- | Bob |
Bob |
- | 81911 |
appareils 3 | 4 people: 246, Bob , 3579 , 81911 |
2 personnes: Bob, 3579 |
3 personnes:246 , 3579 , 81911 |
Conditions préalables
Les conditions préalables suivantes s’appliquent spécifiquement au groupement basé sur les champs :
-
Le jeu de données d’événement dans Adobe Experience Platform auquel vous souhaitez appliquer un groupement doit comporter deux colonnes permettant d’identifier les visiteurs :
- Un identifiant persistant, un identifiant disponible sur chaque ligne. Il peut s’agir, par exemple, d’un identifiant visiteur généré par une bibliothèque Adobe Analytics AppMeasurement ou d’un ECID généré par Adobe Experience Platform Identity Service.
- Identifiant transitoire, disponible uniquement sur certaines lignes. Par exemple, un nom d’utilisateur ou une adresse e-mail chiffré une fois qu’un visiteur s’authentifie. Vous pouvez utiliser pratiquement n’importe quel identifiant de votre choix. Le groupement prend en compte ce champ pour contenir les informations de l’ID de personne réel. Pour de meilleurs résultats d’assemblage, un identifiant temporaire doit être envoyé dans les événements du jeu de données au moins une fois pour chaque identifiant persistant. Si vous prévoyez d’inclure ce jeu de données dans une connexion Customer Journey Analytics, il est préférable que les autres jeux de données aient également un identifiant commun similaire.
Limites
Les restrictions suivantes s’appliquent spécifiquement au groupement basé sur les champs :
- Les capacités de recomposition de données actuelles sont limitées à une étape (identifiant persistant à identifiant transitoire). La recomposition de données à plusieurs étapes (par exemple, un identifiant persistant à un identifiant transitoire, puis à un autre identifiant transitoire) n’est pas prise en charge.
- Si un appareil est partagé par plusieurs personnes et que le nombre total de transitions entre les utilisateurs dépasse 50 000, Customer Journey Analytics cesse d’assembler les données de cet appareil.
- Les mappages d’identifiants personnalisés utilisés dans votre organisation ne sont pas pris en charge.
- Le groupement est sensible à la casse. Pour les jeux de données générés par le biais du connecteur source Analytics, Adobe recommande de passer en revue les règles VISTA ou les règles de traitement qui s’appliquent au champ d’ID temporaire. Cette révision permet de s’assurer qu’aucune de ces règles n’introduit de nouvelles formes du même ID. Par exemple, vous devez vous assurer quʼaucune règle VISTA ou de traitement nʼintroduit de minuscules dans le champ ID temporaire sur une partie seulement des événements.
- L’assemblage ne combine ni ne concatène les champs.
- Le champ ID transitoire doit contenir un seul type d’ID (identifiants d’un seul espace de noms). Par exemple, le champ ID temporaire ne doit pas contenir une combinaison dʼidentifiants de connexion et dʼadresses électroniques.
- Si plusieurs événements se produisent avec le même horodatage pour le même ID persistant, mais avec des valeurs différentes dans le champ ID transitoire , l’assemblage sélectionne l’ID par ordre alphabétique. Ainsi, si l’ID persistant A comporte deux événements avec le même horodatage et que l’un des événements spécifie Bob et que l’autre spécifie Ann, l’assemblage sélectionne Ann.
- Faites attention aux scénarios où les identifiants transitoires contiennent des valeurs d’espace réservé, par exemple
Undefined
. Voir la FAQ pour plus d’informations. - Vous ne pouvez pas utiliser le même espace de noms à la fois persistentID et transientID. Les espaces de noms doivent s’exclure mutuellement.