此使用案例說明如何使用 Merge 中的功能 Deduplication 活動。
如需有關此功能的詳細資訊,請參閱 本節.
此 Deduplication activity用於從資料集中移除重複列。 在此使用案例中,根據「電子郵件」欄位會複製下列資料。
上次修改日期 | 名字 | 姓氏 | 電子郵件 | 行動電話 | 電話 |
---|---|---|---|---|---|
5/19/2020 | Robert | Tisner | bob@mycompany.com | 444-444-444 | 777-777-7777 |
7/22/2020 | Bobby | Tisner | bob@mycompany.com | 777-777-7777 | |
10/03/2020 | Bob | bob@mycompany.com | 888-888-8888 |
使用重複資料刪除活動的 Merge 基本功能,您可以設定一組重複資料刪除的規則,以定義要合併成單一結果資料記錄的一組欄位。 例如,如果有一組重複記錄,您可以選擇保留最舊的電話號碼或最新的名稱。
若要啟用合併功能,您必須先設定 Deduplication 活動。 要執行此操作,請依照下列步驟執行:
開啟活動,然後按一下 [編輯設定] 連結。
選取要用於重複資料刪除的調解欄位,然後按一下 Next. 在此範例中,我們要根據電子郵件欄位進行重複資料刪除。
按一下 Advanced parameters 連結,然後啟動 Merge records 和 Use several record merging criteria 選項。
此 Merge 索引標籤已新增至 Deduplication 設定畫面。 我們將使用此索引標籤來指定執行重複資料刪除時要合併的資料。
以下是我們要用來將資料合併成單一記錄的規則:
若要設定這些規則,請遵循下列步驟:
開啟 Merge 標籤,然後按一下 Add 按鈕。
指定要合併之欄位群組的識別碼和標籤。
指出選取要考慮之記錄的條件。
排序上次修改日期,以選取最近的名稱。
選取要合併的欄位。 在此範例中,我們要保留名字和姓氏欄位。
欄位會新增至要合併的資料集,而新元素會新增至工作流程結構描述。
重複這些步驟以設定行動電話和電話欄位。
設定這些規則後,系統會在結尾收到以下資料 Deduplication 活動。
修改日期 | 名字 | 姓氏 | 電子郵件 | 行動電話 | 電話 |
---|---|---|---|---|---|
5/19/2020 | Robert | Tisner | bob@mycompany.com | 444-444-444 | 777-777-7777 |
7/22/2020 | Bobby | Tisner | bob@mycompany.com | 777-777-7777 | |
10/03/2020 | Bob | bob@mycompany.com | 888-888-8888 |
根據先前設定的規則,從三個記錄合併結果。 比較後得出結論,系統會使用最新名稱和行動電話,以及原始電話號碼。
名字 | 姓氏 | 電子郵件 | 行動電話 | 電話 |
---|---|---|---|---|
Bobby | Tisner | bob@mycompany.com | 444-444-4444 | 888-888-8888 |
請注意,已合併的名字是「Bobby」,因為我們設定了同時包含名字和姓氏欄位的「Name」規則。
因此,「Bob」(最新的名字)無法列入考量,因為其相關聯的姓氏欄位是空的。 名字和姓氏的最新組合已合併到最終記錄中。