Deduplica deduplication
Descrizione description
L’attività Deduplication ti consente di eliminare i duplicati nei risultati delle attività in entrata.
Contesto di utilizzo context-of-use
L’attività Deduplication viene generalmente utilizzata dopo attività di targeting o dopo l’importazione di un file e prima di attività che consentono l’utilizzo di dati oggetto di targeting.
Durante la deduplicazione, le transizioni in entrata vengono elaborate separatamente. Ad esempio, se il profilo “A” è presente nel risultato della query 1 e anche nel risultato della query 2, non verrà deduplicato.
È consigliabile pertanto che una deduplicazione abbia una sola transizione in entrata. A questo scopo, puoi combinare le diverse query utilizzando attività che corrispondono alle tue esigenze di targeting, come un’attività di unione, un’attività di intersezione, ecc. Ad esempio:
Argomenti correlati
Configurazione configuration
Per configurare un’attività di deduplicazione, devi immettere un’etichetta, il metodo e i criteri di deduplicazione, nonché le opzioni relative al risultato.
-
Trascina e rilascia un’attività Deduplication nel flusso di lavoro.
-
Seleziona l’attività, quindi aprila utilizzando il pulsante delle azioni rapide visualizzate.
-
Seleziona il Resource type su cui eseguire la deduplicazione:
- Database resource se la deduplicazione viene eseguita su dati già presenti nel database. Seleziona la Filtering dimension e la Targeting dimension, a seconda dei dati da deduplicare. Per impostazione predefinita, la deduplicazione viene eseguita sui profili.
- Temporary resource se la deduplicazione viene eseguita sui dati temporanei del flusso di lavoro: seleziona il Targeted set che contiene i dati da deduplicare. Questo caso di utilizzo può essere rilevato dopo l’importazione di un file o se i dati nel database sono stati arricchiti (ad esempio con un codice di segmento).
-
Seleziona Number of unique records to keep. Il valore predefinito per questo campo è 1. Il valore 0 ti consente di conservare tutti i duplicati.
Ad esempio, se i record A e B sono considerati duplicati del record Y e il record C è considerato un duplicato del record Z:
- Se il valore del campo è 1: vengono conservati solo i record Y e Z.
- Se il valore del campo è 0: vengono conservati tutti i record.
- Se il valore del campo è 2: vengono conservati i record C e Z e due record tra A, B e Y, per caso o a seconda del metodo di deduplicazione selezionato successivamente.
-
Definisci i criteri di Duplicate identification aggiungendo condizioni nell’elenco fornito. Specifica i campi e/o le espressioni per i quali i valori identici consentono l’identificazione dei duplicati: indirizzo e-mail, nome, cognome, ecc. L’ordine delle condizioni ti consente di specificare quali elaborare per prime.
-
Nell’elenco a discesa, seleziona il Deduplication method da utilizzare:
-
Choose for me: seleziona in modo casuale il record da escludere dai duplicati.
-
Following a list of values: ti consente di definire un valore di priorità per uno o più campi. Per definire i valori, seleziona un campo o crea un’espressione, quindi aggiungi i valori nella tabella appropriata. Per definire un nuovo campo, fai clic sul pulsante Add situato sopra l’elenco dei valori.
-
Non-empty value: questo ti consente di conservare i record per i quali il valore dell’espressione selezionata non è vuoto come priorità.
-
Using an expression: questo ti consente di conservare i record in cui il valore dell’espressione immessa è il minore o il maggiore.
-
-
Se necessario, gestisci le Transizioni dell’attività per accedere alle opzioni avanzate per la popolazione in uscita.
-
Conferma la configurazione dell’attività e salva il flusso di lavoro.