중복 제거 deduplication
중복 제거는 인바운드 활동의 결과에서 중복을 삭제합니다. 중복 제거는 이메일 주소, 전화 번호 또는 다른 필드에서 수행할 수 있습니다.
Deduplication 활동은 데이터 집합에서 중복 행을 제거하는 데 사용됩니다. 예를 들어, 아래 레코드는 동일한 이메일 주소 및 동일한 모바일 및/또는 홈 전화를 가지므로 중복으로 간주될 수 있습니다.
중복 항목을 식별한 후 Deduplication 활동에는 전체 행을 고유 레코드로 유지할 수 있는 기능이 있습니다. 예를 들어 위의 사용 사례에서 활동이 가장 오래된 Date 의 레코드만 유지하도록 구성된 경우 결과는 다음과 같습니다.
선택한 주 레코드는 중복 행의 다른 관련 데이터와 필드 데이터를 병합하지 않고 데이터를 전달합니다.
보조 항목:
모범 사례 best-practices
중복 제거 동안 인바운드 흐름이 별도로 처리됩니다. 예를 들어 수신자 A가 쿼리 2의 결과와 쿼리 1의 결과에 있는 경우 중복 제거되지 않습니다.
이 문제는 다음과 같이 해결해야 합니다.
- 유니온 활동을 만들어 각 인바운드 흐름을 통합하십시오.
- 결합 활동 후에 중복 제거 활동을 만듭니다.
구성 configuration
중복 제거를 구성하려면 해당 레이블, 방법, 중복 제거 기준 및 결과에 대한 옵션을 입력합니다.
-
중복 제거 모드를 정의하려면 Edit configuration… 링크를 클릭하십시오.
-
이 활동에 대한 대상 유형(기본적으로 중복 제거는 수신자에게 연결됨)과 사용할 기준(즉, 동일한 값을 사용하여 중복을 식별할 수 있는 필드)을 선택합니다.
note note NOTE 외부 파일 등의 외부 데이터를 입력으로 사용하는 경우 Temporary schema 옵션을 선택해야 합니다. 다음 단계에서는 Other 옵션을 사용하여 사용할 기준을 선택할 수 있습니다. -
다음 단계에서는 Other 옵션을 사용하여 동일한 값의 경우에 사용할 기준을 선택할 수 있습니다.
-
드롭다운 목록에서 사용할 중복 제거 방법을 선택하고, 유지할 중복 항목 수를 입력합니다.
다음 방법을 사용할 수 있습니다.
-
Choose for me: 중복 중에서 유지할 레코드를 임의로 선택합니다.
-
Following a list of values: 하나 이상의 필드에 대한 값 우선 순위를 정의할 수 있습니다. 값을 정의하려면 필드를 선택하거나 표현식을 만든 다음 해당 테이블에 값을 추가합니다. 새 필드를 정의하려면 값 목록 위에 있는 Add 버튼을 클릭합니다.
-
Non-empty value: 선택한 표현식의 값이 비어 있지 않은 레코드를 우선 순위로 유지할 수 있습니다.
-
Using an expression: 지정된 식의 가장 낮은(또는 가장 높은) 값을 가진 레코드를 유지할 수 있습니다.
note note NOTE Advanced parameters 링크를 통해 액세스할 수 있는 Merge 기능을 사용하면 필드 또는 필드 그룹을 하나의 결과 데이터 레코드로 병합하기 위해 규칙 집합을 구성할 수 있습니다. 자세한 내용은 필드를 단일 레코드로 병합을 참조하십시오. -
-
선택한 중복 제거 방법을 승인하려면 Finish 을(를) 클릭하십시오.
창의 중간 섹션에 정의된 구성이 요약됩니다.
활동 편집기 창의 아래 섹션에서 그래픽 객체의 아웃바운드 전환에 대한 레이블을 수정하고 활동 결과와 연결할 세그먼트 코드를 입력할 수 있습니다. 이 코드는 나중에 타깃팅 기준으로 사용할 수 있습니다.
-
나머지 모집단을 활용하려면 Generate complement 옵션을 선택하십시오. 보완은 모든 중복으로 구성됩니다. 그런 다음 다음과 같이 추가 전환이 활동에 추가됩니다.
예: 게재 전 중복 항목 식별 example--identify-the-duplicates-before-a-delivery
다음 예에서는 중복 제거가 세 쿼리의 통합과 관련이 있습니다.
워크플로우의 목표는 동일한 수신자에게 여러 번 보내지 않도록 중복을 제외하여 게재 대상을 정의하는 것입니다.
식별된 복제본은 전용 복제 목록에도 통합되어 필요한 경우 재사용할 수 있습니다.
-
위에 표시된 대로 워크플로우가 작동하는 데 필요한 다양한 활동을 추가하고 연결합니다.
결합 활동은 여기에서 세 개의 쿼리를 하나의 전환으로 "통합"하는 데 사용됩니다. 따라서 중복 제거는 각 쿼리에 대해 개별적으로 작동하지 않고 쿼리 전체에 대해 작동합니다. 이 주제에 대한 자세한 내용은 모범 사례를 참조하세요.
-
중복 제거 활동을 연 다음 Edit configuration… 링크를 클릭하여 중복 제거 모드를 정의합니다.
-
새 창에서 Database schema 을(를) 선택합니다.
-
수신자 를 타깃팅 및 필터링 차원으로 선택합니다.
-
Email 복제에 대한 ID 필드를 선택하여 모든 전자 메일 주소에 게재를 한 번만 보낸 다음 Next 을(를) 클릭합니다.
특정 필드에 중복 ID를 사용하려면 Other 을(를) 선택하여 사용 가능한 필드 목록에 액세스합니다.
-
여러 수신자에 대해 동일한 이메일 주소가 식별되는 경우 하나의 항목만 유지하도록 선택합니다.
-
Choose for me 중복 제거 모드를 선택하여 식별된 중복 시 저장된 레코드를 임의로 선택한 다음 Finish 을(를) 클릭합니다.
워크플로우를 실행할 때 중복으로 식별된 모든 수신자가 결과(및 게재)에서 제외되고 중복 목록에 추가됩니다. 중복을 다시 식별하지 않고 이 목록을 다시 사용할 수 있습니다.
필드를 단일 데이터 레코드로 병합 merging-fields-into-single-record
Merge 기능을 사용하면 중복 제거에 대한 규칙 집합을 구성하여 단일 결과 데이터 레코드로 병합할 필드 또는 필드 그룹을 정의할 수 있습니다.
예를 들어 중복 레코드 집합이 있는 경우 가장 오래된 전화 번호나 가장 최근 이름을 유지하도록 선택할 수 있습니다.
이 기능을 활용하는 사용 사례는 이 섹션에서 사용할 수 있습니다.
이렇게 하려면 다음 단계를 수행합니다.
-
Deduplication method 선택 단계에서 Advanced Parameters 링크를 클릭합니다.
-
기능을 활성화하려면 Merge records 옵션을 선택하십시오.
각 병합 조건에서 여러 데이터 필드를 그룹화하려면 Use several record merging criteria 옵션을 활성화합니다.
-
기능을 활성화하면 Merge 탭이 Deduplication 활동에 추가됩니다. 병합할 필드 그룹과 관련 규칙을 정의할 수 있습니다.
자세한 내용은 이 섹션에서 사용 가능한 전용 사용 사례를 참조하세요.
입력 매개 변수 input-parameters
- tableName
- 스키마
각 인바운드 이벤트는 이러한 매개 변수로 정의된 대상을 지정해야 합니다.
출력 매개 변수 output-parameters
- tableName
- 스키마
- recCount
이 세 가지 값 세트는 중복 제거의 결과 타겟을 식별합니다. tableName 은(는) 대상 식별자를 저장하는 테이블의 이름이고, schema 은(는) 모집단의 스키마(일반적으로 nms:recipient)이며, recCount 은(는) 테이블의 요소 수입니다.
보체와 관련된 전환은 동일한 매개 변수를 갖는다.