v7

Utilizzare la funzionalità di unione dell’attività Deduplicazione

Informazioni su questo caso d’uso

Questo caso d’uso descrive come utilizzare Merge funzionalità in Deduplication attività.

Per ulteriori informazioni su questa funzionalità, consulta questa sezione.

Il Deduplication L’attività viene utilizzata per rimuovere le righe duplicate da un set di dati. In questo caso d’uso, i dati mostrati di seguito vengono duplicati in base al campo E-mail.

Data ultima modifica Nome Cognome E-mail Telefono cellulare Telefono
5/19/2020 Robert Tisner bob@mycompany.com 444-444-444 777-777-7777
7/22/2020 Bobby Tisner bob@mycompany.com 777-777-7777
10/03/2020 Bob bob@mycompany.com 888-888-8888

Con l’attività Deduplicazione di Merge funzionalità, puoi configurare un set di regole per la deduplicazione per definire un gruppo di campi da unire in un singolo record di dati risultante. Ad esempio, con un set di record duplicati, è possibile scegliere di mantenere il numero di telefono meno recente o il nome più recente.

Attivazione della funzionalità di unione

Per abilitare la funzionalità di unione, devi innanzitutto configurare Deduplication attività. Per farlo, esegui questi passaggi:

  1. Apri l’attività, quindi fai clic su [Modifica configurazione] collegamento.

  2. Seleziona il campo di riconciliazione da utilizzare per la deduplicazione, quindi fai clic su Next. In questo esempio, vogliamo deduplicare in base al campo e-mail.

  3. Fai clic su Advanced parameters , quindi attiva il Merge records e Use several record merging criteria opzioni.

  4. Il Merge viene aggiunta alla scheda Deduplication schermata di configurazione. Questa scheda consente di specificare i dati da unire durante l’esecuzione della deduplicazione.

Configurazione dei campi da unire

Di seguito sono elencate le regole che desideri utilizzare per unire i dati in un singolo record:

  • Mantieni il nome più recente (campi nome e cognome).
  • Mantieni il telefono cellulare più recente,
  • Mantieni il numero di telefono meno recente,
  • Tutti i campi di un gruppo devono essere non nulli per essere idonei per il record finale.

Per configurare queste regole, effettua le seguenti operazioni:

  1. Apri Merge , quindi fare clic sulla scheda Add pulsante.

  2. Specifica l’identificatore e l’etichetta del gruppo di campi da unire.

  3. Indicare le condizioni per la selezione dei record da prendere in considerazione.

  4. Ordina in base all’ultima data di modifica per selezionare il nome più recente.

  5. Selezionare i campi da unire. In questo esempio, è necessario mantenere i campi Nome e Cognome.

  6. I campi vengono aggiunti al set di dati da unire e un nuovo elemento viene aggiunto allo schema del flusso di lavoro.

    Ripeti questi passaggi per configurare i campi relativi al telefono cellulare e al telefono.

Risultati

Dopo aver configurato queste regole, i seguenti dati vengono ricevuti alla fine del Deduplication attività.

Data di modifica Nome Cognome E-mail Telefono cellulare Telefono
5/19/2020 Robert Tisner bob@mycompany.com 444-444-444 777-777-7777
7/22/2020 Bobby Tisner bob@mycompany.com 777-777-7777
10/03/2020 Bob bob@mycompany.com 888-888-8888

Il risultato viene unito dai tre record in base alle regole configurate in precedenza. Dopo il confronto, si conclude che vengono utilizzati il nome e il telefono cellulare più recenti, insieme al numero di telefono originale.

Nome Cognome E-mail Telefono cellulare Telefono
Bobby Tisner bob@mycompany.com 444-444-4444 888-888-8888
NOTA

Il nome che è stato unito è "Bobby", perché abbiamo configurato una regola "Name" composta sia dal nome che dal cognome.

Di conseguenza, "Bob" (il nome più recente) non poteva essere preso in considerazione perché il relativo campo del cognome associato era vuoto. La combinazione più recente di nome e cognome è stata unita nel record finale.

In questa pagina