Utilizzare la funzionalità di unione dell’attività Deduplicazione deduplication-merge
Informazioni su questo caso d’uso about-this-use-case
Questo caso d'uso descrive come utilizzare la funzionalità Merge nell'attività Deduplication.
Per ulteriori informazioni su questa funzionalità, consulta questa sezione.
L'attività Deduplication viene utilizzata per rimuovere righe duplicate da un set di dati. In questo caso d’uso, i dati mostrati di seguito vengono duplicati in base al campo E-mail.
Con la funzionalità Merge dell'attività Deduplicazione, è possibile configurare un set di regole per la deduplicazione in modo da definire un gruppo di campi da unire in un singolo record di dati risultante. Ad esempio, con un set di record duplicati, è possibile scegliere di mantenere il numero di telefono meno recente o il nome più recente.
Attivazione della funzionalità di unione activating-merge
Per abilitare la funzionalità di unione, è innanzitutto necessario configurare l'attività Deduplication. Per farlo, segui questi passaggi:
-
Apri l'attività, quindi fai clic sul collegamento [Modifica configurazione].
-
Selezionare il campo di riconciliazione da utilizzare per la deduplicazione, quindi fare clic su Next. In questo esempio, vogliamo deduplicare in base al campo e-mail.
-
Fare clic sul collegamento Advanced parameters, quindi attivare le opzioni Merge records e Use several record merging criteria.
-
La scheda Merge è stata aggiunta alla schermata di configurazione Deduplication. Questa scheda consente di specificare i dati da unire durante l’esecuzione della deduplicazione.
Configurazione dei campi da unire configuring-rules
Di seguito sono elencate le regole che desideri utilizzare per unire i dati in un singolo record:
- Mantieni il nome più recente (campi nome e cognome).
- Mantieni il telefono cellulare più recente,
- Mantieni il numero di telefono meno recente,
- Tutti i campi di un gruppo devono essere non nulli per essere idonei per il record finale.
Per configurare queste regole, effettua le seguenti operazioni:
-
Apri la scheda Merge, quindi fai clic sul pulsante Add.
-
Specifica l’identificatore e l’etichetta del gruppo di campi da unire.
-
Indicare le condizioni per la selezione dei record da prendere in considerazione.
-
Ordina in base all’ultima data di modifica per selezionare il nome più recente.
-
Selezionare i campi da unire. In questo esempio, è necessario mantenere i campi Nome e Cognome.
-
I campi vengono aggiunti al set di dati da unire e un nuovo elemento viene aggiunto allo schema del flusso di lavoro.
Ripeti questi passaggi per configurare i campi relativi al telefono cellulare e al telefono.
Risultati results
Dopo aver configurato queste regole, i seguenti dati vengono ricevuti alla fine dell'attività Deduplication.
Il risultato viene unito dai tre record in base alle regole configurate in precedenza. Dopo il confronto, si conclude che vengono utilizzati il nome e il telefono cellulare più recenti, insieme al numero di telefono originale.