Utiliser la fonctionnalité de fusion de l’activité de déduplication deduplication-merge
À propos de ce cas d'utilisation about-this-use-case
Ce cas d’utilisation décrit l’utilisation de la fonctionnalité Fusion dans l’activité Déduplication.
Pour plus d’informations sur cette fonctionnalité, consultez cette section.
L'activité Déduplication est utilisée pour supprimer des lignes en double d'un jeu de données. Dans ce cas pratique, les données présentées ci-dessous sont dupliquées en fonction du champ Email.
Avec la fonctionnalité Fusion de l'activité Déduplication, vous pouvez configurer un jeu de règles pour que la déduplication définisse un groupe de champs à fusionner dans un seul enregistrement de données obtenu. Par exemple, avec un ensemble d’enregistrements en doublon, vous pouvez choisir de conserver le numéro de téléphone le plus ancien ou le nom le plus récent.
Activation de la fonctionnalité Fusion activating-merge
Pour activer la fonctionnalité de fusion, vous devez d'abord configurer l'activité Déduplication. Pour ce faire, procédez comme suit :
-
Ouvrez l’activité, puis cliquez sur le lien [Editer la configuration].
-
Sélectionnez le champ de réconciliation à utiliser pour la déduplication, puis cliquez sur Suivant. Dans cet exemple, nous voulons dédupliquer en fonction du champ de l'email.
-
Cliquez sur le lien Paramètres avancés, puis activez les options Fusionner les enregistrements et Utiliser plusieurs critères de fusion des enregistrements.
-
L'onglet Fusion est ajouté à l'écran de configuration de Déduplication. Cet onglet permet de spécifier les données à fusionner lors de l'exécution de la déduplication.
Configuration des champs à fusionner configuring-rules
Voici les règles à utiliser pour fusionner les données en un seul enregistrement :
- Conserver le nom le plus récent (champs de prénom et de nom),
- Conserver le téléphone portable le plus récent,
- Conserver le numéro de téléphone le plus ancien,
- Tous les champs d’un groupe doivent être non nuls pour être éligibles à l’enregistrement final.
Pour configurer ces règles, procédez comme suit :
-
Ouvrez l'onglet Fusion, puis cliquez sur le bouton Ajouter.
-
Indiquez l'identifiant et le libellé du groupe de champs à fusionner.
-
Indiquez les conditions de sélection des enregistrements à prendre en compte.
-
Triez la date de la dernière modification afin de sélectionner le nom le plus récent.
-
Sélectionnez les champs à fusionner. Dans cet exemple, nous voulons conserver les champs de prénom et de nom.
-
Les champs sont ajoutés au jeu de données à fusionner et un nouvel élément est ajouté au schéma de workflow.
Répétez ces étapes pour configurer les champs de téléphone et de téléphone mobile.
Résultats results
Après avoir configuré ces règles, les données suivantes sont reçues à la fin de l'activité Déduplication.
Le résultat est fusionné à partir des trois enregistrements selon les règles configurées précédemment. Après comparaison, il est conclu que le nom et le téléphone mobile les plus récents sont utilisés, ainsi que le numéro de téléphone original.