중복 제거 deduplication

중복 제거는 인바운드 활동의 결과에서 중복을 삭제합니다. 중복 제거는 이메일 주소, 전화 번호 또는 다른 필드에서 수행할 수 있습니다.

Deduplication 활동은 데이터 집합에서 중복 행을 제거하는 데 사용됩니다. 예를 들어, 아래 레코드는 동일한 이메일 주소 및 동일한 모바일 및/또는 홈 전화를 가지므로 중복으로 간주될 수 있습니다.

마지막 수정일
이름
이메일
휴대폰
휴대폰
2020/03/02
Bob
티스너
bob@mycompany.com
444-444-4444
888-888-8888
2020/05/19
로버트
티스너
bob@mycompany.com
444-444-4444
777-777-7777
2020년 7월 22일
보비
티스너
bob@mycompany.com
444-444-4444
777-777-7777

중복 항목을 식별한 후 Deduplication 활동에는 전체 행을 고유 레코드로 유지할 수 있는 기능이 있습니다. 예를 들어 위의 사용 사례에서 활동이 가장 오래된 Date ​의 레코드만 유지하도록 구성된 경우 결과는 다음과 같습니다.

일자
이름
이메일
휴대폰
휴대폰
2020/03/02
Bob
티스너
bob@mycompany.com
444-444-4444
888-888-8888

선택한 주 레코드는 중복 행의 다른 관련 데이터와 필드 데이터를 병합하지 않고 데이터를 전달합니다.

보조 항목:

일자
이름
이메일
휴대폰
휴대폰
2020/05/19
로버트
티스너
bob@mycompany.com
444-444-4444
777-777-7777
2020년 7월 22일
보비
티스너
bob@mycompany.com
444-444-4444
777-777-7777

모범 사례 best-practices

중복 제거 동안 인바운드 흐름이 별도로 처리됩니다. 예를 들어 수신자 A가 쿼리 2의 결과와 쿼리 1의 결과에 있는 경우 중복 제거되지 않습니다.

이 문제는 다음과 같이 해결해야 합니다.

  • 유니온 활동을 만들어 각 인바운드 흐름을 통합하십시오.
  • 결합 활동 후에 중복 제거 활동을 만듭니다.

구성 configuration

중복 제거를 구성하려면 해당 레이블, 방법, 중복 제거 기준 및 결과에 대한 옵션을 입력합니다.

  1. 중복 제거 모드를 정의하려면 Edit configuration… 링크를 클릭하십시오.

  2. 이 활동에 대한 대상 유형(기본적으로 중복 제거는 수신자에게 연결됨)과 사용할 기준(즉, 동일한 값을 사용하여 중복을 식별할 수 있는 필드)을 선택합니다.

    note note
    NOTE
    외부 파일 등의 외부 데이터를 입력으로 사용하는 경우 Temporary schema 옵션을 선택해야 합니다.
    다음 단계에서는 Other 옵션을 사용하여 사용할 기준을 선택할 수 있습니다.

  3. 다음 단계에서는 Other 옵션을 사용하여 동일한 값의 경우에 사용할 기준을 선택할 수 있습니다.

  4. 드롭다운 목록에서 사용할 중복 제거 방법을 선택하고, 유지할 중복 항목 수를 입력합니다.

    다음 방법을 사용할 수 있습니다.

    • Choose for me: 중복 중에서 유지할 레코드를 임의로 선택합니다.

    • Following a list of values: 하나 이상의 필드에 대한 값 우선 순위를 정의할 수 있습니다. 값을 정의하려면 필드를 선택하거나 표현식을 만든 다음 해당 테이블에 값을 추가합니다. 새 필드를 정의하려면 값 목록 위에 있는 Add 버튼을 클릭합니다.

    • Non-empty value: 선택한 표현식의 값이 비어 있지 않은 레코드를 우선 순위로 유지할 수 있습니다.

    • Using an expression: 지정된 식의 가장 낮은(또는 가장 높은) 값을 가진 레코드를 유지할 수 있습니다.

    note note
    NOTE
    Advanced parameters 링크를 통해 액세스할 수 있는 Merge 기능을 사용하면 필드 또는 필드 그룹을 하나의 결과 데이터 레코드로 병합하기 위해 규칙 집합을 구성할 수 있습니다. 자세한 내용은 필드를 단일 레코드로 병합을 참조하십시오.
  5. 선택한 중복 제거 방법을 승인하려면 Finish ​을(를) 클릭하십시오.

    창의 중간 섹션에 정의된 구성이 요약됩니다.

    활동 편집기 창의 아래 섹션에서 그래픽 객체의 아웃바운드 전환에 대한 레이블을 수정하고 활동 결과와 연결할 세그먼트 코드를 입력할 수 있습니다. 이 코드는 나중에 타깃팅 기준으로 사용할 수 있습니다.

  6. 나머지 모집단을 활용하려면 Generate complement 옵션을 선택하십시오. 보완은 모든 중복으로 구성됩니다. 그런 다음 다음과 같이 추가 전환이 활동에 추가됩니다.

예: 게재 전 중복 항목 식별 example--identify-the-duplicates-before-a-delivery

다음 예에서는 중복 제거가 세 쿼리의 통합과 관련이 있습니다.

워크플로우의 목표는 동일한 수신자에게 여러 번 보내지 않도록 중복을 제외하여 게재 대상을 정의하는 것입니다.

식별된 복제본은 전용 복제 목록에도 통합되어 필요한 경우 재사용할 수 있습니다.

  1. 위에 표시된 대로 워크플로우가 작동하는 데 필요한 다양한 활동을 추가하고 연결합니다.

    결합 활동은 여기에서 세 개의 쿼리를 하나의 전환으로 "통합"하는 데 사용됩니다. 따라서 중복 제거는 각 쿼리에 대해 개별적으로 작동하지 않고 쿼리 전체에 대해 작동합니다. 이 주제에 대한 자세한 내용은 모범 사례를 참조하세요.

  2. 중복 제거 활동을 연 다음 Edit configuration… 링크를 클릭하여 중복 제거 모드를 정의합니다.

  3. 새 창에서 Database schema ​을(를) 선택합니다.

  4. 수신자 ​를 타깃팅 및 필터링 차원으로 선택합니다.

  5. Email 복제에 대한 ID 필드를 선택하여 모든 전자 메일 주소에 게재를 한 번만 보낸 다음 Next ​을(를) 클릭합니다.

    특정 필드에 중복 ID를 사용하려면 Other ​을(를) 선택하여 사용 가능한 필드 목록에 액세스합니다.

  6. 여러 수신자에 대해 동일한 이메일 주소가 식별되는 경우 하나의 항목만 유지하도록 선택합니다.

  7. Choose for me 중복 제거 모드를 선택하여 식별된 중복 시 저장된 레코드를 임의로 선택한 다음 Finish ​을(를) 클릭합니다.

워크플로우를 실행할 때 중복으로 식별된 모든 수신자가 결과(및 게재)에서 제외되고 중복 목록에 추가됩니다. 중복을 다시 식별하지 않고 이 목록을 다시 사용할 수 있습니다.

필드를 단일 데이터 레코드로 병합 merging-fields-into-single-record

Merge 기능을 사용하면 중복 제거에 대한 규칙 집합을 구성하여 단일 결과 데이터 레코드로 병합할 필드 또는 필드 그룹을 정의할 수 있습니다.

예를 들어 중복 레코드 집합이 있는 경우 가장 오래된 전화 번호나 가장 최근 이름을 유지하도록 선택할 수 있습니다.

이 기능을 활용하는 사용 사례는 이 섹션에서 사용할 수 있습니다.

이렇게 하려면 다음 단계를 수행합니다.

  1. Deduplication method 선택 단계에서 Advanced Parameters 링크를 클릭합니다.

  2. 기능을 활성화하려면 Merge records 옵션을 선택하십시오.

    각 병합 조건에서 여러 데이터 필드를 그룹화하려면 Use several record merging criteria 옵션을 활성화합니다.

  3. 기능을 활성화하면 Merge 탭이 Deduplication 활동에 추가됩니다. 병합할 필드 그룹과 관련 규칙을 정의할 수 있습니다.

    자세한 내용은 이 섹션에서 사용 가능한 전용 사용 사례를 참조하세요.

입력 매개 변수 input-parameters

  • tableName
  • 스키마

각 인바운드 이벤트는 이러한 매개 변수로 정의된 대상을 지정해야 합니다.

출력 매개 변수 output-parameters

  • tableName
  • 스키마
  • recCount

이 세 가지 값 세트는 중복 제거의 결과 타겟을 식별합니다. tableName ​은(는) 대상 식별자를 저장하는 테이블의 이름이고, schema ​은(는) 모집단의 스키마(일반적으로 nms:recipient)이며, recCount ​은(는) 테이블의 요소 수입니다.

보체와 관련된 전환은 동일한 매개 변수를 갖는다.

recommendation-more-help
cffff7e4-091f-472e-87ca-52087599f99d