Deduplicatie deduplication
De Deduplicatie activiteit is a richtend activiteit. Deze activiteit schrapt duplicaten in de resultaten van binnenkomende activiteiten, zoals gedupliceerde profielen in de ontvankelijke lijst. De Deduplicatie activiteit wordt over het algemeen gebruikt na het richten van activiteiten en vóór activiteiten die gerichte gegevens gebruiken.
De activiteit steunt veelvoudige binnenkomende overgangen. Wanneer meer dan één binnenkomende overgang beschikbaar is, gebruik de Reeksen om zich bij sectie in de activiteiteneigenschappen aan te sluiten om te selecteren welke overgangen om met de activiteit te verbinden. De geselecteerde overgangen worden dan verbonden met Deduplicatie in het werkschemacanvas.
De deduplicatieactiviteit configureren deduplication-configuration
Voer de volgende stappen uit om de Deduplication -activiteit te configureren:
-
Voeg de activiteit van de a Deduplicatie aan uw werkschema toe.
-
In de Reeksen om zich bij sectie aan te sluiten, controleer de vorige activiteiten u wenst om als binnenkomende overgangen van de Deduplicatie activiteit te verbinden. De geselecteerde activiteiten worden dan verbonden met Deduplicatie in het werkschemacanvas. Gebruik het Primaire vastgestelde gebied om de verwijzing binnenkomende overgang te bepalen. Records uit de andere sets worden vergeleken met de primaire set om duplicaten te identificeren.
note NOTE Deze sectie wordt slechts getoond wanneer meer dan één binnenkomende overgang beschikbaar is. -
In de Gebieden om duplicaten sectie te identificeren, klik voegt attribuut knoop toe om de gebieden te specificeren waarvoor de identieke waarden duplicaten toestaan om, zoals e-mailadres, voornaam, en achternaam worden geïdentificeerd. De volgorde van de velden geeft aan welke velden eerst moeten worden verwerkt. Leer hoe te om attributen te selecteren en hen toe te voegen aan favorieten .
-
In de montages van de Deduplicatie sectie, selecteer het aantal unieke Duplicaten om te houden. De standaardwaarde voor dit veld is 1. Met de waarde 0 blijven alle duplicaten behouden.
Bijvoorbeeld, als de verslagen A en B als duplicaten van verslag Y worden beschouwd, en verslag C als duplicaat van verslag Z wordt beschouwd:
- Als de waarde van het veld 1 is: alleen de Y- en Z-gegevens worden bewaard.
- Wanneer de waarde van het veld 0 is: alle registers worden bijgehouden.
- Als de waarde van het veld 2 is: de records C en Z worden bewaard en twee records van A, B en Y worden bewaard, hetzij bij toeval, hetzij afhankelijk van de gekozen deduplicatiemethode.
-
Selecteer de methode van de Deduplicatie aan gebruik:
- Willekeurige selectie: Hiermee selecteert u willekeurig de record om geen duplicaten meer te gebruiken.
- Gebruikend een uitdrukking: Hiermee worden de records bijgehouden waarin de waarde van de ingevoerde expressie het kleinst of het grootst is.
- Niet-lege waarden: Hiermee worden de records gehouden waarvoor de expressie niet leeg is.
- na een lijst van waarden: Definieert een prioriteit voor een of meer velden. Om de waarden te bepalen, klik Attribuut om een gebied te selecteren of een uitdrukking tot stand te brengen, dan de waarden in de aangewezen lijst toe te voegen. Om een nieuw gebied te bepalen, klik voeg knoop toe die boven de lijst van waarden wordt gevestigd.
-
Controleer aanvult optie om de resterende bevolking te exploiteren. Het complement bestaat uit alle duplicaten. Vervolgens wordt een aanvullende overgang toegevoegd aan de activiteit.
Voorbeeld deduplication-example
In het volgende voorbeeld gebruikt u een deduplicatie-activiteit om duplicaten uit te sluiten van het doel voordat u een levering verzendt. De geïdentificeerde gedupliceerde profielen worden toegevoegd aan een specifiek publiek dat indien nodig opnieuw kan worden gebruikt. Kies het E-mail adres om de duplicaten te identificeren. Houd 1 ingang en selecteer de Willekeurige deduplicatiemethode.