Deduplication

Descrizione

L’attività Deduplication ti consente di eliminare i duplicati nei risultati delle attività in entrata.

Contesto di utilizzo

L’attività Deduplication viene generalmente utilizzata dopo attività di targeting o dopo l’importazione di un file e prima di attività che consentono l’utilizzo di dati oggetto di targeting.

Durante la deduplicazione, le transizioni in entrata vengono elaborate separatamente. Ad esempio, se il profilo “A” è presente nel risultato della query 1 e anche nel risultato della query 2, non verrà deduplicato.

È consigliabile pertanto che una deduplicazione abbia una sola transizione in entrata. A questo scopo, puoi combinare le diverse query utilizzando attività che corrispondono alle tue esigenze di targeting, come un’attività di unione, un’attività di intersezione, ecc. Ad esempio:

Argomenti correlati

Configurazione

Per configurare un’attività di deduplicazione, devi immettere un’etichetta, il metodo e i criteri di deduplicazione, nonché le opzioni relative al risultato.

  1. Trascina e rilascia un’attività Deduplication nel flusso di lavoro.

  2. Seleziona l’attività, quindi aprila utilizzando il pulsante delle azioni rapide visualizzate.

  3. Seleziona il Resource type su cui eseguire la deduplicazione:

    • Database resource se la deduplicazione viene eseguita su dati già presenti nel database. Seleziona la Filtering dimension e la Targeting dimension, a seconda dei dati da deduplicare. Per impostazione predefinita, la deduplicazione viene eseguita sui profili.
    • Temporary resource se la deduplicazione viene eseguita sui dati temporanei del flusso di lavoro: seleziona il Targeted set che contiene i dati da deduplicare. Questo caso di utilizzo può essere rilevato dopo l’importazione di un file o se i dati nel database sono stati arricchiti (ad esempio con un codice di segmento).
  4. Seleziona Number of unique records to keep. Il valore predefinito per questo campo è 1. Il valore 0 ti consente di conservare tutti i duplicati.

    Ad esempio, se i record A e B sono considerati duplicati del record Y e il record C è considerato un duplicato del record Z:

    • Se il valore del campo è 1: vengono conservati solo i record Y e Z.
    • Se il valore del campo è 0: vengono conservati tutti i record.
    • Se il valore del campo è 2: vengono conservati i record C e Z e due record tra A, B e Y, per caso o a seconda del metodo di deduplicazione selezionato successivamente.
  5. Definisci i criteri di Duplicate identification aggiungendo condizioni nell’elenco fornito. Specifica i campi e/o le espressioni per i quali i valori identici consentono l’identificazione dei duplicati: indirizzo e-mail, nome, cognome, ecc. L’ordine delle condizioni ti consente di specificare quali elaborare per prime.

  6. Nell’elenco a discesa, seleziona il Deduplication method da utilizzare:

    • Choose for me: seleziona in modo casuale il record da escludere dai duplicati.

    • Following a list of values: ti consente di definire un valore di priorità per uno o più campi. Per definire i valori, seleziona un campo o crea un’espressione, quindi aggiungi i valori nella tabella appropriata. Per definire un nuovo campo, fai clic sul pulsante Add situato sopra l’elenco dei valori.

    • Non-empty value: questo ti consente di conservare i record per i quali il valore dell’espressione selezionata non è vuoto come priorità.

    • Using an expression: questo ti consente di conservare i record in cui il valore dell’espressione immessa è il minore o il maggiore.

  7. Se necessario, gestisci le Transizioni dell’attività per accedere alle opzioni avanzate per la popolazione in uscita.

  8. Conferma la configurazione dell’attività e salva il flusso di lavoro.

In questa pagina