Déduplication deduplication
L’activité Déduplication est une activité de ciblage. Cette activité supprime les doublons dans les résultats des activités entrantes, tels que les profils dupliqués dans la liste des destinataires. L’activité Déduplication est généralement utilisée à la suite des activités de ciblage et avant les activités utilisant les données ciblées.
L’activité prend en charge plusieurs transitions entrantes. Lorsque plusieurs transitions entrantes sont disponibles, utilisez la section Ensembles à joindre dans les propriétés de l’activité pour sélectionner les transitions à connecter à l’activité. Les transitions sélectionnées sont ensuite liées à la Déduplication dans la zone de travail du workflow.
Configurer l’activité Déduplication deduplication-configuration
Pour configurer l’activité Déduplication, procédez comme suit :
-
Ajoutez une activité Déduplication à votre workflow.
-
Dans la section Ensembles à joindre, cochez les activités précédentes à connecter en tant que transitions entrantes de l’activité Déduplication. Les activités sélectionnées sont ensuite liées à la Déduplication dans la zone de travail du workflow. Utilisez le champ Ensemble de Principal pour définir la transition entrante de référence. Les enregistrements des autres ensembles sont comparés à l’ensemble principal pour identifier les doublons.
note NOTE Cette section ne s’affiche que lorsque plusieurs transitions entrantes sont disponibles. -
Dans la section Champs pour identifier les doublons, cliquez sur le bouton Ajouter un attribut pour indiquer les champs pour lesquels des valeurs identiques permettent d’identifier les doublons, par exemple : adresse e-mail, prénom, nom, etc. L’ordre des champs permet de spécifier ceux à traiter en premier. Découvrez comment sélectionner des attributs et les ajouter aux favoris.
-
Dans la section Paramètres de déduplication, sélectionnez le nombre de Doublons à conserver uniques. La valeur par défaut de ce champ est 1. La valeur 0 conserve tous les doublons.
Par exemple, si des enregistrements A et B sont considérés comme des doublons d’un enregistrement Y, et qu’un enregistrement C est considéré comme un doublon d’un enregistrement Z :
- Si la valeur du champ est 1 : seuls les enregistrements Y et Z sont conservés.
- Si la valeur du champ est 0 : tous les enregistrements sont conservés.
- Si la valeur du champ est 2 : les enregistrements C et Z sont conservés et deux enregistrements parmi A, B et Y sont conservés, au hasard ou en fonction de la méthode de déduplication choisie.
-
Sélectionnez la méthode de déduplication à utiliser :
- Sélection aléatoire : sélectionne au hasard parmi les doublons l’enregistrement à conserver.
- À partir d’une expression : conserve les enregistrements dont la valeur de l’expression renseignée est la plus petite ou la plus grande.
- Valeurs non vides : conserve les enregistrements pour lesquels l’expression n’est pas vide.
- Par ordonnancement de valeurs : définit un ordre de priorité des valeurs pour un ou plusieurs champs. Pour définir les valeurs, cliquez sur Attributs pour sélectionner un champ ou créez une expression, puis ajoutez les valeurs dans le tableau correspondant. Cliquez sur le bouton Ajouter situé au-dessus de la liste des valeurs pour définir un nouveau champ.
-
Cochez l’option Générer le complément si vous souhaitez exploiter la population restante. Le complémentaire est constitué de tous les doublons. Une transition supplémentaire sera alors ajoutée à l’activité.
Exemple deduplication-example
Dans l’exemple suivant, utilisez une activité Déduplication pour exclure les doublons de la cible avant l’envoi d’une diffusion. Les profils dupliqués identifiés sont ajoutés à une audience dédiée qui peut être réutilisée si nécessaire. Choisissez l’adresse e-mail pour identifier les doublons. Conservez une entrée et sélectionnez la méthode de déduplication aléatoire.