Utiliser la fonctionnalité de fusion de l’activité de déduplication deduplication-merge

À propos de ce cas d'utilisation about-this-use-case

Ce cas d’utilisation décrit l’utilisation de la fonctionnalité Fusion dans l’activité Déduplication.

Pour plus d’informations sur cette fonctionnalité, consultez cette section.

L'activité Déduplication est utilisée pour supprimer des lignes en double d'un jeu de données. Dans ce cas pratique, les données présentées ci-dessous sont dupliquées en fonction du champ Email.

Date de la dernière modification
Prénom
Nom
Email
Téléphone mobile
Phone
5/19/2020
Robert
Tisner
bob@mycompany.com
444-444-444
777-777-7777
7/22/2020
Bobby
Tisner
bob@mycompany.com
777-777-7777
10/03/2020
Bob
bob@mycompany.com
888-888-8888

Avec la fonctionnalité Fusion de l'activité Déduplication, vous pouvez configurer un jeu de règles pour que la déduplication définisse un groupe de champs à fusionner dans un seul enregistrement de données obtenu. Par exemple, avec un ensemble d’enregistrements en doublon, vous pouvez choisir de conserver le numéro de téléphone le plus ancien ou le nom le plus récent.

Activation de la fonctionnalité Fusion activating-merge

Pour activer la fonctionnalité de fusion, vous devez d'abord configurer l'activité Déduplication. Pour ce faire, procédez comme suit :

  1. Ouvrez l’activité, puis cliquez sur le lien [Editer la configuration].

  2. Sélectionnez le champ de réconciliation à utiliser pour la déduplication, puis cliquez sur Suivant. Dans cet exemple, nous voulons dédupliquer en fonction du champ de l'email.

  3. Cliquez sur le lien Paramètres avancés, puis activez les options Fusionner les enregistrements et Utiliser plusieurs critères de fusion des enregistrements.

  4. L'onglet Fusion est ajouté à l'écran de configuration de Déduplication. Cet onglet permet de spécifier les données à fusionner lors de l'exécution de la déduplication.

Configuration des champs à fusionner configuring-rules

Voici les règles à utiliser pour fusionner les données en un seul enregistrement :

  • Conserver le nom le plus récent (champs de prénom et de nom),
  • Conserver le téléphone portable le plus récent,
  • Conserver le numéro de téléphone le plus ancien,
  • Tous les champs d’un groupe doivent être non nuls pour être éligibles à l’enregistrement final.

Pour configurer ces règles, procédez comme suit :

  1. Ouvrez l'onglet Fusion, puis cliquez sur le bouton Ajouter.

  2. Indiquez l'identifiant et le libellé du groupe de champs à fusionner.

  3. Indiquez les conditions de sélection des enregistrements à prendre en compte.

  4. Triez la date de la dernière modification afin de sélectionner le nom le plus récent.

  5. Sélectionnez les champs à fusionner. Dans cet exemple, nous voulons conserver les champs de prénom et de nom.

  6. Les champs sont ajoutés au jeu de données à fusionner et un nouvel élément est ajouté au schéma de workflow.

    Répétez ces étapes pour configurer les champs de téléphone et de téléphone mobile.

Résultats results

Après avoir configuré ces règles, les données suivantes sont reçues à la fin de l'activité Déduplication.

Date de modification
Prénom
Nom
Email
Téléphone mobile
Phone
5/19/2020
Robert
Tisner
bob@mycompany.com
444-444-444
777-777-7777
7/22/2020
Bobby
Tisner
bob@mycompany.com
777-777-7777
10/03/2020
Bob
bob@mycompany.com
888-888-8888

Le résultat est fusionné à partir des trois enregistrements selon les règles configurées précédemment. Après comparaison, il est conclu que le nom et le téléphone mobile les plus récents sont utilisés, ainsi que le numéro de téléphone original.

Prénom
Nom
Email
Téléphone mobile
Phone
Bobby
Tisner
bob@mycompany.com
444-444-4444
888-888-8888
NOTE
Notez que le prénom qui a été fusionné est "Bobby", car nous avons configuré une règle "Nom" composée à la fois du prénom et des derniers champs.
Par conséquent, "Bob" (prénom le plus récent) n’a pas pu être pris en compte car le champ de nom associé était vide. La combinaison la plus récente de prénom et nom a été fusionnée dans l’enregistrement final.
recommendation-more-help
cffff7e4-091f-472e-87ca-52087599f99d