Déduplication deduplication

L’activité Déduplication permet de supprimer les doublons dans le ou les résultats des activités entrantes, par exemple les profils dupliqués dans la liste des personnes destinataires. L’activité Déduplication est généralement utilisée à la suite des activités de ciblage et avant les activités permettant d’utiliser les données ciblées.

Configurer l’activité Déduplication deduplication-configuration

Pour configurer l’activité Déduplication, procédez comme suit :

  1. Ajoutez une activité Déduplication à votre composition.

  2. Si l’activité possède plusieurs transitions entrantes, sélectionnez la transition à utiliser pour effectuer la déduplication dans la liste déroulante Ensemble principal.

  3. Dans la section Champs pour identifier des doublons, cliquez sur le bouton Ajouter un attribut pour indiquer les champs pour lesquels des valeurs identiques permettent d’identifier les doublons, par exemple : adresse e-mail, prénom, nom, etc. L’ordre des champs vous permet de spécifier ceux à traiter en premier.

  4. Dans la section Paramètres de déduplication, sélectionnez le nombre de Doublons à conserver uniques. La valeur par défaut de champ est  1. La valeur  0 permet de conserver tous les doublons.

    Par exemple, si les enregistrements A et B sont considérés comme des doublons de l’enregistrement Y et qu’un enregistrement C est considéré comme un doublon de l’enregistrement Z :

    • Si la valeur du champ est  1  : seuls les enregistrements Y et Z sont conservés.
    • Si la valeur du champ est  0  : tous les enregistrements sont conservés.
    • Si la valeur du champ est  2  : les enregistrements C et Z sont conservés et deux enregistrements parmi A, B et Y sont conservés, par hasard ou selon la méthode de déduplication sélectionnée par la suite.
  5. Sélectionnez la méthode de déduplication à utiliser :

    • Sélection aléatoire  : sélectionne au hasard l’enregistrement à conserver parmi les doublons.
    • À partir d’une expression  : permet de conserver les enregistrements dont la valeur de l’expression renseignée est la plus petite ou la plus grande.
    • Valeurs non vides  : conserve les enregistrements pour lesquels l’expression n’est pas vide.
    • Par ordonnancement de valeurs  : définit un ordre de priorité des valeurs pour un ou plusieurs champs. Pour définir les valeurs, cliquez sur Attributs pour sélectionner un champ ou créez une expression, puis ajoutez la ou les valeurs dans le tableau correspondant. Pour définir un nouveau champ, cliquez sur le bouton Ajouter situé au-dessus de la liste des valeurs.
  6. Cochez l’option Générer le complément si vous souhaitez exploiter la population restante. Le complément est constitué de tous les doublons. Une transition supplémentaire sera alors ajoutée à l’activité.

recommendation-more-help
fadff0d9-29d0-4d44-99a6-2499b0b7778b