Déduplication deduplication
L’activité Déduplication est une activité de ciblage. Cette activité permet de supprimer les doublons dans le ou les résultats des activités entrantes, par exemple les profils dupliqués dans la liste des profils destinataires. L’activité Déduplication est généralement utilisée à la suite des activités de ciblage et avant les activités permettant d’utiliser les données ciblées.
Configurer l’activité Déduplication deduplication-configuration
Pour configurer l’activité Déduplication, procédez comme suit :
-
Ajoutez une activité Déduplication à votre campagne orchestrée.
-
Dans la section Champs pour identifier des doublons, cliquez sur le bouton Ajouter un attribut pour indiquer les champs pour lesquels des valeurs identiques permettent d’identifier les doublons, par exemple : adresse e-mail, prénom, nom, etc. L’ordre des champs vous permet de spécifier ceux à traiter en premier.
-
Dans la section Paramètres de déduplication, choisissez le nombre d’enregistrements uniques à conserver à l’aide du champ Doublons à conserver. La valeur par défaut est 1, ce qui permet de conserver un enregistrement par groupe de doublons. Définissez-la sur 0 pour conserver tous les doublons.
Par exemple, si des enregistrements A et B sont des doublons de Y, et qu’un enregistrement C est un doublon de Z :
- Si la valeur du champ est 1 : seuls les enregistrements Y et Z sont conservés.
- Si la valeur du champ est 0 : tous les enregistrements (A, B, C, Y, Z) sont conservés.
- Si la valeur du champ est 2 : les enregistrements C et Z sont conservés, ainsi que deux valeurs de A, B et Y, de façon aléatoire ou selon votre méthode de déduplication.
-
Choisissez une Méthode de déduplication. Celle-ci définit la manière dont le système décide des enregistrements à conserver à partir de chaque groupe de doublons :
- Sélection aléatoire : sélectionne au hasard l’enregistrement à conserver parmi les doublons.
- En utilisant une expression : conserve les enregistrements dont la valeur est la plus élevée ou la plus faible en fonction d’une expression que vous définissez.
- Valeurs non vides : conserve les enregistrements dans lesquels le champ sélectionné n’est pas vide, par exemple ne conserve que les profils ayant un numéro de téléphone.
- En suivant une liste de valeurs : permet de prioriser des valeurs spécifiques pour un ou plusieurs champs, par exemple donner la priorité aux enregistrements dont le champ « Pays » est défini sur la France. Cliquez sur Attribut pour choisir un champ ou créer une expression personnalisée. Utilisez le bouton Ajouter pour saisir les valeurs préférées dans l’ordre de priorité.
-
Cochez l’option Générer le complément si vous souhaitez exploiter la population restante. Le complément est constitué de tous les doublons. Une transition supplémentaire sera alors ajoutée à l’activité.
Exemple deduplication-example
Dans l’exemple suivant, une activité Déduplication est utilisée pour supprimer les enregistrements en double de l’audience cible avant d’envoyer une diffusion. L’audience est d’abord filtrée pour inclure uniquement les profils dont le champ E-mail n’est pas vide. Ensuite, l’activité Déduplication utilise l’adresse e-mail pour identifier et exclure les doublons.