重複排除アクティビティの結合機能の使用 deduplication-merge
このユースケースについて about-this-use-case
このユースケースでは、「重複排除」アクティビティで 結合 機能を使用する方法を説明します。
この機能について詳しくは、この節を参照してください。
重複排除 - 重複 アクティビティは、データセットから重複行を削除するために使用します。 この使用例では、次のデータがメールフィールドに基づいて複製されます。
重複排除 - 重複アクティビティの 結合 機能を使用して、重複排除 - 重複の一連のルールを設定し、単一の結果データレコードに結合するフィールドのグループを定義できます。 例えば、一連の重複レコードでは、最も古い電話番号または最新の名前を保持するように選択できます。
結合機能の有効化 activating-merge
結合機能を有効にするには、まず 重複排除 - 重複 アクティビティを設定する必要があります。 それをおこなうには、次の手順に従います。
-
アクティビティを開き、「[設定を編集]」リンクをクリックします。
-
重複排除 - 重複に使用する紐付けフィールドを選択し、「次へ」をクリックします。 この例では、メールフィールドに基づいて重複除外をおこないます。
-
「詳細設定パラメーター」リンクをクリックし、「レコードを結合」および「複数レコードの結合条件を使用」オプションを有効にします。
-
「結合」タブが 重複排除 - 重複 設定画面に追加されます。 このタブを使用して、重複排除 - 重複の実行時に結合するデータを指定します。
結合するフィールドの設定 configuring-rules
データを単一のレコードに結合する際に使用するルールを次に示します。
- 最新の名前(名と姓の各フィールド)を保持し、
- 最新の携帯電話を保持し、
- 最も古い電話番号を保持します。
- 最終レコードに適格なグループ内のすべてのフィールドは、null 以外である必要があります。
これらのルールを設定するには、次の手順に従います。
-
「結合」タブを開き、「追加」ボタンをクリックします。
-
結合するフィールドのグループの識別子とラベルを指定します。
-
考慮するレコードを選択する条件を指定します。
-
最新の名前を選択するために、最終変更日に並べ替えます。
-
結合するフィールドを選択します。この例では、姓と名のフィールドを保持します。
-
結合するデータのセットにフィールドが追加され、新しい要素がワークフロースキーマに追加されます。
以下の手順を繰り返して、携帯電話および電話のフィールドを設定します。
結果 results
これらのルールを設定した後、重複排除 - 重複 アクティビティの最後に次のデータを受け取ります。
前述のルールに従って、3 つのレコードから結果が結合されます。 比較後、最新の名前と携帯電話が、元の電話番号と共に使用されていると結論付けられます。