Usar a funcionalidade de mesclagem da atividade de desduplicação deduplication-merge
Sobre este caso de uso about-this-use-case
Este caso de uso descreve como usar a funcionalidade Merge na atividade de Deduplication.
Para obter mais informações sobre essa funcionalidade, consulte esta seção.
A atividade Deduplication é usada para remover linhas duplicadas de um conjunto de dados. Nesse caso de uso, os dados mostrados abaixo são duplicados com base no campo Email.
Com a funcionalidade da atividade Desduplicação Merge, é possível configurar um conjunto de regras para a desduplicação para definir um grupo de campos a serem mesclados em um único registro de dados resultante. Por exemplo, com um conjunto de registros duplicados, você pode optar por manter o número de telefone mais antigo ou o nome mais recente.
Ativação da funcionalidade Mesclar activating-merge
Para habilitar a funcionalidade de mesclagem, primeiro é necessário configurar a atividade Deduplication. Para fazer isso, siga estes passos:
-
Abra a atividade e clique no link [Editar configuração].
-
Selecione o campo de reconciliação a ser usado para a desduplicação e clique em Next. Neste exemplo, queremos desduplicar com base no campo de email.
-
Clique no link Advanced parameters e ative as opções Merge records e Use several record merging criteria.
-
A guia Merge é adicionada à tela de configuração Deduplication. Usaremos essa guia para especificar os dados a serem mesclados ao executar a desduplicação.
Configurar os campos para mesclar configuring-rules
Estas são as regras que queremos usar para mesclar os dados em um único registro:
- Manter o nome mais recente (campos de nome e sobrenome),
- Manter o telefone celular mais recente,
- Manter o número de telefone mais antigo,
- Todos os campos em um grupo devem ser não nulos a fim de se qualificarem para o registro final.
Para configurar essas regras, siga estas etapas:
-
Abra a guia Merge e clique no botão Add.
-
Especifique o identificador e o rótulo do grupo de campos que serão mesclados.
-
Indique as condições de seleção dos registros que serão considerados.
-
Classifique pela última data de modificação para selecionar o nome mais recente.
-
Selecione os campos que serão mesclados. Neste exemplo, queremos manter os campos de nome e sobrenome.
-
Os campos são adicionados ao conjunto de dados para mesclagem, e um novo elemento é adicionado ao esquema de fluxo de trabalho.
Repita essas etapas para configurar os campos de telefone celular e telefone.
Resultados results
Depois da configuração dessas regras, os dados a seguir são recebidos ao fim da atividade Deduplication.
O resultado é mesclado dos três registros de acordo com as regras configuradas anteriormente. Após a comparação, conclui-se que o nome e o telefone celular mais recentes são usados, juntamente com o número de telefone original.