La actividad Deduplication le permite eliminar duplicados en los resultados de las actividades entrantes.
La actividad Deduplication se utiliza generalmente después de actividades de segmentación o después de importar un archivo y antes de actividades que permiten el uso de datos de objetivo.
Durante la deduplicación, las transiciones entrantes se procesan por separado. Por ejemplo, si el perfil “A” está presente como resultado de la consulta 1 y también como resultado de la consulta 2, no se deduplicará.
Por lo tanto, se aconseja que una deduplicación solo tenga una transición entrante. Para ello, puede combinar sus diferentes consultas mediante actividades que se correspondan con sus necesidades de segmentación, como una actividad de unión, una actividad de intersección, etc. Por ejemplo:
Temas relacionados
Para configurar una actividad de deduplicación, debe introducir una etiqueta, el método y los criterios de deduplicación, así como las opciones relacionadas con el resultado.
Arrastre y suelte una actividad de Deduplication en el flujo de trabajo.
Seleccione la actividad y, a continuación, ábrala con el botón , en las acciones rápidas que aparecerán.
Seleccione el Resource type en que debe llevarse a cabo la deduplicación:
Seleccione el Number of unique records to keep. El valor predeterminado de este campo es 1. El valor 0 le permite mantener todos los duplicados.
Por ejemplo, si los registros A y B se consideran duplicados del registro Y, y un registro C se considera un duplicado del registro Z:
Defina los criterios Duplicate identification agregando condiciones en la lista proporcionada. Especifique los campos o expresiones para los que los valores idénticos permiten identificar los duplicados: dirección de correo electrónico, nombre, apellidos, etc. El orden de las condiciones le permite especificar las que se procesarán en primer lugar.
En la lista desplegable, seleccione el Deduplication method que desee utilizar:
Choose for me: selecciona de forma aleatoria el registro que se va a excluir de los duplicados.
Following a list of values: permite definir una prioridad de valor para uno o varios campos. Para definir los valores, seleccione un campo o cree una expresión y, a continuación, añada los valores a la tabla adecuada. Para definir un nuevo campo, haga clic en el botón Add situado sobre la lista de valores.
Non-empty value: esto permite mantener registros para los que el valor de la expresión seleccionada no está vacío como prioridad.
Using an expression: esto le permite mantener los registros en los que el valor de la expresión introducida es el más pequeño o el más grande.
Si es necesario, administre las Transiciones de la actividad para acceder a las opciones avanzadas de la población saliente.
Confirme la configuración de la actividad y guarde el flujo de trabajo.