Deduplicering deduplication
Beskrivning description
Med den här Deduplication-aktiviteten kan du ta bort dubbletter i resultatet/resultaten av de inkommande aktiviteterna.
Kontext för användning context-of-use
Aktiviteten Deduplication används vanligtvis efter målaktiviteter eller efter import av en fil och före aktiviteter som tillåter användning av måldata.
Vid borttagning av dubbletter behandlas inkommande övergångar separat. Om till exempel profilen A finns i resultatet av fråga 1, och även i resultatet av fråga 2, kommer den inte att dedupliceras.
Därför rekommenderar vi att en deduplicering endast har en ingående övergång. Du kan göra detta genom att kombinera dina olika frågor med aktiviteter som motsvarar dina målgruppsbehov, till exempel en fackaktivitet, en skärningsaktivitet, o.s.v. Exempel:
Relaterade ämnen
Konfiguration configuration
Om du vill konfigurera en dedupliceringsaktivitet måste du ange en etikett, metod och dedupliceringskriterier samt alternativ som relaterar till resultatet.
-
Dra och släpp en Deduplication-aktivitet i arbetsflödet.
-
Markera aktiviteten och öppna den sedan med knappen bland de snabbåtgärder som visas.
-
Välj den Resource type som dedupliceringen ska utföras på:
- Database resource om dedupliceringen utförs på data som redan finns i databasen. Markera Filtering dimension och Targeting dimension, beroende på vilka data du vill deduplicera. Som standard utförs deduplicering på profilerna.
- Temporary resource om dedupliceringen utförs på arbetsflödets tillfälliga data: markera den Targeted set som innehåller de data som ska dedupliceras. Detta kan inträffa när du har importerat en fil eller när data i databasen har berikats (med en segmentkod, till exempel).
-
Markera Number of unique records to keep. Standardvärdet för det här fältet är 1. Med värdet 0 kan du behålla alla dubbletter.
Om till exempel posterna A och B betraktas som dubbletter av posten Y, och en post C betraktas som en dubblett av posten Z:
- Om värdet för fältet är 1: endast Y- och Z-posterna behålls.
- Om värdet för fältet är 0: alla register förs.
- Om värdet för fältet är 2: Posterna C och Z förvaras och två poster från A, B och Y sparas, av en tillfällighet eller beroende på vilken dedupliceringsmetod som valts därefter.
-
Definiera villkoren genom att lägga till villkor i den angivna listan Duplicate identification. Ange de fält och/eller uttryck för vilka identiska värden gör att dubbletter kan identifieras: e-postadress, förnamn, efternamn, o.s.v. Du kan ange i vilken ordning villkoren ska behandlas först.
-
I listrutan väljer du den Deduplication method som ska användas:
-
Choose for me: Markerar slumpmässigt den post som ska hållas utanför dubbletterna.
-
Following a list of values: Låter dig definiera en värdeprioritet för ett eller flera fält. Om du vill definiera värdena markerar du ett fält eller skapar ett uttryck och lägger sedan till värdena i rätt tabell. Om du vill definiera ett nytt fält klickar du på knappen Add ovanför listan med värden.
-
Non-empty value: Låter dig behålla poster där värdet för det valda uttrycket inte är tomt som prioritet.
-
Using an expression: Låter dig behålla de poster där det angivna uttryckets värde är det minsta eller det största.
-
-
Hantera vid behov aktivitetens övergångar för åtkomst till de avancerade alternativen för den utgående populationen.
-
Bekräfta aktivitetens konfiguration och spara arbetsflödet.