[v7]{class="badge informative" title="Gäller endast Campaign Classic v7"}

Deduplicering deduplication

Borttagning av dubbletter tar bort dubbletter från resultatet av inkommande aktiviteter. Deduplicering kan utföras på e-postadressen, telefonnumret eller något annat fält.

The Deduplication används för att ta bort dubblettrader från en datauppsättning. Posterna nedan kan till exempel betraktas som dubbletter eftersom de har samma e-postadress och samma mobil- och/eller hemtelefon.

Senaste ändringsdatum
Förnamn
Efternamn
E-post
Mobiltelefon
Telefon
02/03/2020
Bob
Tisner
bob@mycompany.com
444-444-4444
888-888-8888
05/19/2020
Robert
Tisner
bob@mycompany.com
444-444-4444
777-777-777
07/22/2020
Bobby
Tisner
bob@mycompany.com
444-444-4444
777-777-777

The Deduplication -aktiviteten kan behålla en hel rad som den unika posten när dubbletter har identifierats. I ovanstående exempel gäller till exempel om aktiviteten är konfigurerad att bara behålla posten med den äldsta Date blir resultatet:

Datum
Förnamn
Efternamn
E-post
Mobiltelefon
Telefon
02/03/2020
Bob
Tisner
bob@mycompany.com
444-444-4444
888-888-8888

Den markerade huvudposten överför data utan att fältdata sammanfogas med andra relevanta data i de duplicerade raderna.

Komplettera:

Datum
Förnamn
Efternamn
E-post
Mobiltelefon
Telefon
05/19/2020
Robert
Tisner
bob@mycompany.com
444-444-4444
777-777-777
07/22/2020
Bobby
Tisner
bob@mycompany.com
444-444-4444
777-777-777

Bästa praxis best-practices

Vid borttagning av dubbletter behandlas inkommande flöden separat. Om till exempel mottagare A hittas i resultatet av fråga 1 och i resultatet av fråga 2, kommer de inte att dedupliceras.

Denna fråga måste åtgärdas på följande sätt:

  • Skapa en Union för att sammanföra varje inkommande flöde.
  • Skapa en Deduplicering aktivitet efter Union aktivitet.

Konfiguration configuration

Om du vill konfigurera en borttagning av dubbletter anger du dess etikett, metod, borttagningsvillkor och alternativ för resultatet.

  1. Klicka på Edit configuration… för att definiera dedupliceringsläget.

  2. Välj måltyp för den här aktiviteten (som standard är borttagning av dubbletter länkad till mottagare) och vilket kriterium som ska användas, dvs. fältet som identiskt värden gör att du kan identifiera dubbletter för.

    note note
    NOTE
    Om du använder externa data som indata, till exempel från en extern fil, måste du markera Temporary schema alternativ.
    I nästa steg Other kan du välja vilket eller vilka kriterier som ska användas:

  3. I nästa steg Other kan du välja vilket eller vilka kriterier som ska användas om värdena är identiska.

  4. I listrutan väljer du den borttagningsmetod som ska användas och anger antalet kopior som ska behållas.

    Följande metoder är tillgängliga:

    • Choose for me: Markerar slumpmässigt den post som ska hållas utanför dubbletterna.

    • Following a list of values: Låter dig definiera en värdeprioritet för ett eller flera fält. Om du vill definiera värdena markerar du ett fält eller skapar ett uttryck och lägger sedan till värdena i rätt tabell. Om du vill definiera ett nytt fält klickar du på knappen Add ovanför listan med värden.

    • Non-empty value: Låter dig behålla poster där värdet för det valda uttrycket inte är tomt som prioritet.

    • Using an expression: gör att du kan behålla poster med det lägsta (eller högsta) värdet för det angivna uttrycket.

    note note
    NOTE
    The Merge funktionalitet, tillgänglig via Advanced parameters kan du konfigurera en uppsättning regler för att sammanfoga ett fält eller en grupp med fält till en enda resulterande datapost. Mer information finns i Sammanfoga fält till en enda post.
  5. Klicka Finish för att godkänna den valda dedupliceringsmetoden.

    I fönstrets mellersta del sammanfattas den definierade konfigurationen.

    I det nedre avsnittet av aktivitetsredigeringsfönstret kan du ändra etiketten för den utgående övergången för det grafiska objektet och ange en segmentkod som ska associeras med aktivitetens resultat. Den här koden kan senare användas som målinriktningskriterium.

  6. Kontrollera Generate complement om du vill utnyttja den återstående populationen. Komplementet består av alla dubbletter. Därefter kommer ytterligare en övergång att läggas till i aktiviteten enligt följande:

Exempel: Identifiera dubbletter före leverans example--identify-the-duplicates-before-a-delivery

I följande exempel gäller borttagningen av dubbletter kombinationen av tre frågor.

Målet med arbetsflödet är att definiera målet för en leverans genom att utesluta dubbletter så att det inte skickas till samma mottagare flera gånger.

De identifierade dubbletterna kommer också att integreras i en dedikerad dubblettlista som kan återanvändas om det behövs.

  1. Lägg till och länka de olika aktiviteter som krävs för att arbetsflödet ska fungera enligt ovan.

    Unionsaktiviteten används här för att"sammanfoga" de tre frågorna till en enda övergång. Det innebär att borttagning av dubbletter inte fungerar för varje fråga separat, utan för hela frågan. Mer information om detta finns i God praxis.

  2. Öppna dedupliceringsaktiviteten och klicka sedan på Edit configuration… för att definiera dedupliceringsläget.

  3. I det nya fönstret väljer du Database schema.

  4. Välj Mottagare som målgruppsanpassning och filtrering.

  5. Välj ID-fält för Email dubbletter, om du bara vill skicka leveransen en gång till varje e-postadress och sedan klicka på Next.

    Om du vill basera de duplicerade ID:n på ett visst fält väljer du Other för att komma åt listan med tillgängliga fält.

  6. Välj om du bara vill behålla en post när samma e-postadress identifieras för flera mottagare.

  7. Välj Choose for me dedupliceringsläge så att de poster som sparas vid identifierade dubbletter väljs slumpmässigt och sedan klickar du Finish.

När arbetsflödet körs exkluderas alla mottagare som identifieras som dubbletter från resultatet (och därmed leveransen) och läggs till i dubblettlistan. Den här listan kan användas igen i stället för att du behöver identifiera dubbletterna igen.

Sammanfoga fält till en enda datapost merging-fields-into-single-record

The Merge Med kan du konfigurera en uppsättning regler för borttagning av dubbletter för att definiera ett fält eller en grupp med fält som ska sammanfogas till en enda resulterande datapost.

Om du till exempel har en uppsättning dubblettposter kan du välja att behålla det äldsta telefonnumret eller det senaste namnet.

Ett användningsexempel som utnyttjar den här funktionen finns i det här avsnittet.

Följ dessa steg för att göra detta:

  1. I Deduplication method markeringssteg, klicka på Advanced Parameters länk.

  2. Välj Merge records för att aktivera funktionen.

    Aktivera alternativet Use several record merging criteria alternativ.

  3. När du har aktiverat funktionen kan du Merge -fliken läggs till i Deduplication aktivitet. Det gör att du kan definiera grupper av fält som ska sammanfogas och tillhörande regler.

    Mer information om detta finns i fallstudien för dedikerad användning i det här avsnittet.

Indataparametrar input-parameters

  • tableName
  • schema

Varje inkommande händelse måste ange ett mål som definieras av dessa parametrar.

Utdataparametrar output-parameters

  • tableName
  • schema
  • recCount

Den här uppsättningen med tre värden identifierar det mål som skapas av borttagningen av dubbletter. tableName är namnet på tabellen som sparar målidentifierare, schema är schemat för populationen (vanligtvis nms:mottagare) och recCount är antalet element i tabellen.

Övergången som är associerad med komplementet har samma parametrar.

recommendation-more-help
601d79c3-e613-4db3-889a-ae959cd9e3e1