去重複化

重複資料刪除來自入站活動結果的重複項目。 您可以在電子郵件地址、電話號碼或其他欄位上執行重複資料刪除。

Deduplication​活動用於從資料集中刪除重複行。 例如,以下記錄可能會視為重複,因為它們具有相同的電子郵件地址和相同的行動電話及/或家庭電話。

上次修改日期 名字 姓氏 電子郵件 行動電話 電話
02/03/2020 Bob 蒂斯納 bob@mycompany.com 444-444-4444 888-888-8888
05/19/2020 羅伯特 蒂斯納 bob@mycompany.com 444-444-4444 777-777-7777
07/22/2020 鮑比 蒂斯納 bob@mycompany.com 444-444-4444 777-777-7777

Deduplication​活動能夠在識別重複項目後,將整列保留為唯一記錄。 例如,在上述使用案例中,如果活動設定為僅保留具有最舊​Date​的記錄,則結果為:

日期 名字 姓氏 電子郵件 行動電話 電話
02/03/2020 Bob 蒂斯納 bob@mycompany.com 444-444-4444 888-888-8888

所選主記錄將繼承資料,而不會將欄位資料與重複行中的其他相關資料合併。

補充:

日期 名字 姓氏 電子郵件 行動電話 電話
05/19/2020 羅伯特 蒂斯納 bob@mycompany.com 444-444-4444 777-777-7777
07/22/2020 鮑比 蒂斯納 bob@mycompany.com 444-444-4444 777-777-7777

最佳實務

在重複資料刪除期間,會個別處理入站流程。 例如,如果在查詢1的結果和查詢2的結果中找到收件者A,則不會刪除其重複項目。

需要解決以下問題:

  • 建立​聯合​活動以統一每個入站流。
  • 在​Union​活動之後建立​重複資料刪除​活動。

設定

要配置重複資料刪除,請輸入其標籤、方法和重複資料刪除標準,以及與結果相關的選項。

  1. 按一下​Edit configuration…​連結以定義重複資料刪除模式。

  2. 選取此活動的目標類型(預設情況下,重複資料刪除連結至收件者)和要使用的標準,即相同值的欄位,可讓您識別重複項目。

    注意

    如果您使用外部資料作為輸入,例如從外部檔案,請務必選取​Temporary schema​選項。

    在下一個步驟中, Other​選項可讓您選取要使用的標準或標準:

  3. 在下一步中, Other​選項可讓您選取在值相同時要使用的准則或准則。

  4. 從下拉式清單中,選取要使用的重複資料刪除方法,然後輸入要保留的重複項目數。

    可使用下列方法:

    • Choose for me:隨機選取要保留在重複項目外的記錄。

    • Following a list of values:可讓您定義一或多個欄位的值優先順序。若要定義值,請選取欄位或建立運算式,然後將值新增至適當的資料表中。若要定義新欄位,請按一下值清單上方的 Add 按鈕。

    • Non-empty value:您可以保留所選運算式的值不為空白的記錄作為優先順序。

    • Using an expression:可讓您保留具有指定運算式最低(或最高)值的記錄。

    注意

    可透過​Advanced parameters​連結存取的​Merge​功能可讓您設定一組規則,以將欄位或欄位群組合併為單一產生的資料記錄。 有關詳細資訊,請參閱將欄位合併到單個記錄

  5. 按一下​Finish​以核准所選的重複資料刪除方法。

    視窗的中段會總結定義的設定。

    在活動編輯器視窗的下方區段,您可以修改圖形物件之出站轉變的標籤,並輸入與活動結果相關聯的區段代碼。 此程式碼稍後可用作定位准則。

  6. 如果要利用剩餘母體,請核取​Generate complement​選項。 補充項包含所有重複項。 接著,會新增其他轉變至活動,如下所示:

範例:在傳送之前識別重複項目

在以下範例中,重複資料刪除涉及三個查詢的聯合。

工作流程的目的是透過排除重複項目來定義傳送的目標,以避免將重複項目多次傳送給相同的收件者。

標識的重複項還將整合到專用的重複項清單中,如有必要,可重複使用。

  1. 新增並連結工作流程運作所需的各種活動,如上所示。

    此處的聯合活動用於將三個查詢「統一」為單一轉變。 因此,重複資料刪除不會單獨用於每個查詢,而是整個查詢。 有關此主題的詳細資訊,請參閱最佳實務

  2. 開啟重複資料刪除活動,然後按一下​Edit configuration…​連結以定義重複資料刪除模式。

  3. 在新窗口中,選擇​Database schema

  4. 選擇​收件者​作為目標維度和篩選維度。

  5. 選取​Email​重複項目的ID欄位,只傳送一次至每個電子郵件地址,然後按一下​Next

    如果要將重複ID設定在特定欄位上,請選擇​Other​以訪問可用欄位清單。

  6. 為多個收件者識別相同的電子郵件地址時,選擇僅保留一個項目。

  7. 選擇​Choose for me​重複資料刪除模式,以便隨機選擇在發現重複項時保存的記錄,然後按一下​Finish

執行工作流程時,所有識別為重複項目的收件者都會從結果中排除(因此也會排除傳送),並新增至重複項目清單。 此清單可能會再次使用,而不必重新識別重複項目。

將欄位合併到單個資料記錄

Merge​功能允許您為重複資料刪除配置一組規則,以定義要合併到單個結果資料記錄中的欄位或欄位組。

例如,使用一組重複記錄時,您可以選擇保留最舊的電話號碼或最新名稱。

此區段提供運用此功能的使用案例。

要執行此操作,請依照下列步驟執行:

  1. 在​Deduplication method​選擇步驟中,按一下​Advanced Parameters​連結。

  2. 選擇​Merge records​選項以激活功能。

    如果要在每個合併條件中對多個資料欄位分組,請啟動​Use several record merging criteria​選項。

  3. 啟用功能後, Merge​標籤會新增至​Deduplication​活動。 它可讓您定義要合併的欄位群組及其相關規則。

    有關詳細資訊,請參閱此部分中提供的專用使用案例。

輸入參數

  • tableName
  • 綱要

每個入站事件都必須指定由這些參數定義的目標。

輸出參數

  • tableName
  • 綱要
  • recCount

這組三個值可識別重複資料刪除後產生的目標。 tableName 是儲存目標識別碼的表格名稱, schema 是母體(通常為nms:recipient)的綱要, recCount 是表格中的元素數。

與補體相關聯的轉變具有相同的參數。

本頁內容