Utilizzare la funzionalità di unione dell’attività Deduplicazione deduplication-merge

Informazioni su questo caso d’uso about-this-use-case

Questo caso d'uso descrive come utilizzare la funzionalità Merge nell'attività Deduplication.

Per ulteriori informazioni su questa funzionalità, consulta questa sezione.

L'attività Deduplication viene utilizzata per rimuovere righe duplicate da un set di dati. In questo caso d’uso, i dati mostrati di seguito vengono duplicati in base al campo E-mail.

Data ultima modifica
Nome
Cognome
E-mail
Telefono cellulare
Telefono
5/19/2020
Robert
Tisner
bob@mycompany.com
444-444-444
777 77 77 777
7/22/2020
Bobby
Tisner
bob@mycompany.com
777 77 77 777
10/03/2020
Bob
bob@mycompany.com
888 88 88 888

Con la funzionalità Merge dell'attività Deduplicazione, è possibile configurare un set di regole per la deduplicazione in modo da definire un gruppo di campi da unire in un singolo record di dati risultante. Ad esempio, con un set di record duplicati, è possibile scegliere di mantenere il numero di telefono meno recente o il nome più recente.

Attivazione della funzionalità di unione activating-merge

Per abilitare la funzionalità di unione, è innanzitutto necessario configurare l'attività Deduplication. Per farlo, segui questi passaggi:

  1. Apri l'attività, quindi fai clic sul collegamento [Modifica configurazione].

  2. Selezionare il campo di riconciliazione da utilizzare per la deduplicazione, quindi fare clic su Next. In questo esempio, vogliamo deduplicare in base al campo e-mail.

  3. Fare clic sul collegamento Advanced parameters, quindi attivare le opzioni Merge records e Use several record merging criteria.

  4. La scheda Merge è stata aggiunta alla schermata di configurazione Deduplication. Questa scheda consente di specificare i dati da unire durante l’esecuzione della deduplicazione.

Configurazione dei campi da unire configuring-rules

Di seguito sono elencate le regole che desideri utilizzare per unire i dati in un singolo record:

  • Mantieni il nome più recente (campi nome e cognome).
  • Mantieni il telefono cellulare più recente,
  • Mantieni il numero di telefono meno recente,
  • Tutti i campi di un gruppo devono essere non nulli per essere idonei per il record finale.

Per configurare queste regole, effettua le seguenti operazioni:

  1. Apri la scheda Merge, quindi fai clic sul pulsante Add.

  2. Specifica l’identificatore e l’etichetta del gruppo di campi da unire.

  3. Indicare le condizioni per la selezione dei record da prendere in considerazione.

  4. Ordina in base all’ultima data di modifica per selezionare il nome più recente.

  5. Selezionare i campi da unire. In questo esempio, è necessario mantenere i campi Nome e Cognome.

  6. I campi vengono aggiunti al set di dati da unire e un nuovo elemento viene aggiunto allo schema del flusso di lavoro.

    Ripeti questi passaggi per configurare i campi relativi al telefono cellulare e al telefono.

Risultati results

Dopo aver configurato queste regole, i seguenti dati vengono ricevuti alla fine dell'attività Deduplication.

Data di modifica
Nome
Cognome
E-mail
Telefono cellulare
Telefono
5/19/2020
Robert
Tisner
bob@mycompany.com
444-444-444
777 77 77 777
7/22/2020
Bobby
Tisner
bob@mycompany.com
777 77 77 777
10/03/2020
Bob
bob@mycompany.com
888 88 88 888

Il risultato viene unito dai tre record in base alle regole configurate in precedenza. Dopo il confronto, si conclude che vengono utilizzati il nome e il telefono cellulare più recenti, insieme al numero di telefono originale.

Nome
Cognome
E-mail
Telefono cellulare
Telefono
Bobby
Tisner
bob@mycompany.com
444 44 44 444
888 88 88 888
NOTE
Il nome che è stato unito è "Bobby", perché abbiamo configurato una regola "Name" composta sia dal nome che dal cognome.
Di conseguenza, "Bob" (il nome più recente) non poteva essere preso in considerazione perché il relativo campo del cognome associato era vuoto. La combinazione più recente di nome e cognome è stata unita nel record finale.
recommendation-more-help
cffff7e4-091f-472e-87ca-52087599f99d