Deduplication

Deduplicazione elimina i duplicati dai risultati delle attività in entrata. È possibile eseguire la deduplicazione sull'indirizzo e-mail, sul numero di telefono o su un altro campo.

L'attività Deduplication viene utilizzata per rimuovere righe duplicate da un set di dati. Ad esempio, i record riportati di seguito possono essere considerati duplicati in quanto hanno lo stesso indirizzo e-mail e lo stesso cellulare e/o telefono domestico.

Data ultima modifica Nome Cognome E-mail Cellulare Telefono

| 03/02/2020 | Bob | Tisner | bob@mycompany.com | 444-444-4444 | 888-888-8888 |
| 19/05/2020 | Robert | Tisner | bob@mycompany.com | 444-444-4444 | 777-777-7777 |
| 22/07/2020 | Bobby | Tisner | bob@mycompany.com | 444-444-4444 | 777-777-7777 |

L'attività Deduplication ha la capacità di mantenere un'intera riga come record univoco dopo l'identificazione dei duplicati. Ad esempio, nel caso di utilizzo precedente, se l'attività è configurata per mantenere solo il record con il meno recente Date, il risultato sarebbe:

Data Nome Cognome E-mail Cellulare Telefono

| 03/02/2020 | Bob | Tisner | bob@mycompany.com | 444-444-4444 | 888-888-8888 |

Il record master selezionato porterà i dati senza l'unione dei dati del campo con altri dati pertinenti nelle righe duplicate.

Complemento:

Data Nome Cognome E-mail Cellulare Telefono

| 19/05/2020 | Robert | Tisner | bob@mycompany.com | 444-444-4444 | 777-777-7777 |
| 22/07/2020 | Bobby | Tisner | bob@mycompany.com | 444-444-4444 | 777-777-7777 |

Best practice

Durante la deduplicazione, i flussi in entrata vengono elaborati separatamente. Se, ad esempio, il destinatario A si trova nel risultato della query 1 e nel risultato della query 2, non verrà deduplicato.

Questo problema deve essere affrontato come segue:

  • Create un'attività Union per unificare ogni flusso in entrata.
  • Create un'attività Deduplicazione dopo l'attività Union.

Configurazione

Per configurare una deduplicazione, immettete l’etichetta, il metodo e i criteri di deduplicazione, nonché le opzioni relative al risultato.

  1. Fare clic sul collegamento Edit configuration… per definire la modalità di deduplicazione.

  2. Selezionare il tipo di destinazione per l'attività (per impostazione predefinita, la deduplicazione è collegata ai destinatari) e il criterio da utilizzare, ovvero il campo per il quale valori identici consentono di identificare duplicati.

    NOTA

    Se utilizzate dati esterni come input, ad esempio da un file esterno, accertatevi di selezionare l'opzione Temporary schema.

    Nel passaggio successivo, l'opzione Other consente di selezionare il criterio o i criteri da utilizzare:

  3. Nel passaggio successivo, l'opzione Other consente di selezionare il criterio o i criteri da utilizzare in caso di valori identici.

  4. Dall’elenco a discesa, selezionate il metodo di deduplicazione da utilizzare e immettete il numero di duplicati da conservare.

    Sono disponibili i seguenti metodi:

    • Choose for me: seleziona in modo casuale il record da escludere dai duplicati.

    • Following a list of values: ti consente di definire un valore di priorità per uno o più campi. Per definire i valori, seleziona un campo o crea un’espressione, quindi aggiungi i valori nella tabella appropriata. Per definire un nuovo campo, fai clic sul pulsante Add situato sopra l’elenco dei valori.

    • Non-empty value: questo ti consente di conservare i record per i quali il valore dell’espressione selezionata non è vuoto come priorità.

    • Using an expression: consente di conservare i record con il valore più basso (o più alto) dell'espressione data.

    NOTA

    La funzionalità Merge, accessibile tramite il collegamento Advanced parameters, consente di configurare un insieme di regole per unire un campo o un gruppo di campi in un unico record di dati risultante. Per ulteriori informazioni, vedere Unione dei campi in un singolo record.

  5. Fare clic su Finish per approvare il metodo di deduplicazione selezionato.

    La sezione centrale della finestra riepiloga la configurazione definita.

    Nella sezione inferiore della finestra dell'editor attività, potete modificare l'etichetta per la transizione in uscita dell'oggetto grafico e immettere un codice di segmento che verrà associato al risultato dell'attività. Questo codice può essere utilizzato successivamente come criterio di targeting.

  6. Selezionare l'opzione Generate complement se si desidera sfruttare la popolazione rimanente. Il complemento è costituito da tutti i duplicati. All'attività verrà quindi aggiunta un'ulteriore transizione, come segue:

Esempio: Identificare i duplicati prima della consegna

Nell'esempio seguente, la deduplicazione riguarda l'unione di tre query.

Lo scopo del flusso di lavoro è definire la destinazione per la consegna escludendo i duplicati per evitare di inviarla più volte allo stesso destinatario.

I duplicati identificati saranno inoltre integrati in un elenco dedicato di duplicati, che potrà essere riutilizzato se necessario.

  1. Aggiungete e collegate le varie attività necessarie per il funzionamento del flusso di lavoro, come mostrato sopra.

    L'attività dell'unione viene utilizzata qui per "unificare" le tre query in un'unica transizione. Di conseguenza, la deduplicazione non funziona per ogni query singolarmente ma per l’intera query. Per ulteriori informazioni su questo argomento, fare riferimento a Best practice.

  2. Aprite l'attività di deduplicazione, quindi fate clic sul collegamento Edit configuration… per definire la modalità di deduplicazione.

  3. Nella nuova finestra, selezionare Database schema.

  4. Selezionate Recipients come dimensioni di destinazione e filtro.

  5. Selezionare il campo ID per i duplicati Email, per inviare la consegna una sola volta a ogni indirizzo e-mail, quindi fare clic su Next.

    Se desiderate basare gli ID duplicati su un campo specifico, selezionate Other per accedere all'elenco dei campi disponibili.

  6. Scegliete di mantenere una sola voce quando lo stesso indirizzo e-mail è identificato per più destinatari.

  7. Selezionare la modalità di deduplicazione Choose for me in modo che i record salvati in caso di duplicati identificati vengano scelti in modo casuale, quindi fare clic su Finish.

Durante l'esecuzione del flusso di lavoro, tutti i destinatari identificati come duplicati vengono esclusi dal risultato (e quindi dalla consegna) e aggiunti all'elenco dei duplicati. Questo elenco può essere utilizzato di nuovo anziché dover identificare nuovamente i duplicati.

Unione dei campi in un singolo record di dati

La funzionalità Merge consente di configurare un set di regole per la deduplicazione per definire un campo o un gruppo di campi da unire in un singolo record di dati risultante.

Ad esempio, con un set di record duplicati, potete scegliere di mantenere il numero di telefono più vecchio o il nome più recente.

Un esempio di utilizzo che sfrutta questa funzione è disponibile in questa sezione.

Per farlo, esegui questi passaggi:

  1. Nel passaggio di selezione Deduplication method, fare clic sul collegamento Advanced Parameters.

  2. Selezionare l'opzione Merge records per attivare la funzionalità.

    Se si desidera raggruppare più campi dati in ciascuna condizione di unione, attivare l'opzione Use several record merging criteria.

  3. Dopo aver attivato la funzionalità, all'attività Deduplication viene aggiunta una scheda Merge. Consente di definire i gruppi di campi da unire e le relative regole associate.

    Per ulteriori informazioni, consultare il caso d'uso dedicato disponibile in questa sezione.

Parametri di input

  • tableName
  • schema

Ogni evento in ingresso deve specificare una destinazione definita da questi parametri.

Parametri di output

  • tableName
  • schema
  • recCount

Questo insieme di tre valori identifica la destinazione risultante dalla deduplicazione. tableName è il nome della tabella che salva gli identificatori di destinazione, schema è lo schema della popolazione (in genere nms:destinatario) ed recCount è il numero di elementi nella tabella.

La transizione associata al complemento ha gli stessi parametri.

In questa pagina

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now