重複の除外 deduplication

説明 description

Deduplication」アクティビティでは、インバウンドアクティビティの結果から重複を削除できます。

使用状況 context-of-use

Deduplication」アクティビティは、通常、ターゲティングアクティビティの後またはファイルをインポートした後、およびターゲットデータを使用できるアクティビティの前に使用されます。

重複排除の実行中、インバウンドトランジションは個別に処理されます。例えば、プロファイル A がクエリ 1 とクエリ 2 の結果に見つかった場合、重複排除はおこなわれません。

したがって、重複排除ではインバウンドトランジションを 1 つに絞ることをお勧めします。それには、「和集合」アクティビティや「積集合」アクティビティなど、ターゲティングのニーズに対応したアクティビティを使用して、様々なクエリを組み合わせます。次に例を示します。

関連トピック

設定 configuration

「重複排除 - 重複」アクティビティを設定するには、ラベル、重複排除の方法と条件、結果に関連するオプションを入力する必要があります。

  1. ワークフローに「Deduplication」アクティビティをドラッグ&ドロップします。

  2. アクティビティを選択し、表示されるクイックアクションの ボタンを使用して開きます。

  3. 重複排除の実行対象となる「Resource type」を以下から選択します。

    • Database resource:データベースに既に存在するデータに対して実行する場合。重複排除の対象となるデータに応じて、「Filtering dimension」と「Targeting dimension」を選択します。デフォルトでは、プロファイル ​に対して重複排除が実行されます。
    • Temporary resource:ワークフローの一時データに対して実行する場合。重複排除の対象となるデータを含んだ「Targeted set」を選択します。これは、ファイルのインポート後、またはデータベース内のデータが(セグメントコードなどで)エンリッチされた場合に起こり得るユースケースです。
  4. Number of unique records to keep」を選択します。このフィールドのデフォルト値は 1 です。値 0 を指定すると、すべての重複を保持できます。

    例えば、レコード A と B がレコード Y の重複と見なされ、レコード C がレコード Z の重複と見なされる場合:

    • このフィールドの値が 1 の場合:Y レコードと Z レコードのみが保持されます。
    • このフィールドの値が 0 の場合:すべてのレコードが保持されます。
    • このフィールドの値が 2 の場合:C レコードと Z レコードが保持されます。さらに、偶然に、またはその後選択した重複排除方法によっては、A、B、Y のレコードのうち、2 つのレコードが保持されます。
  5. 提供されるリストに条件を追加して、「Duplicate identification」条件を定義します。メールアドレス、名、姓など、同一の値が存在することで重複を識別できるフィールドや式を指定します。条件の順序によって、最初に処理する条件を指定できます。

  6. ドロップダウンリストで、使用する「Deduplication method」を選択します。

    • Choose for me:重複に含めないレコードがランダムに選択されます。

    • Following a list of values:1 つまたは複数のフィールドに値の優先度を定義できます。優先度の値を定義するには、フィールドを選択するか式を作成し、適切なフィールドに値を追加します。新しいフィールドを定義するには、値のリストの上の「Add」ボタンをクリックします。

    • Non-empty value:選択した式の値が空でないレコードを優先して保持できます。

    • Using an expression:入力した式の値が最小または最大のレコードを保持できます。

  7. 必要に応じて、アクティビティのトランジションを管理して、アウトバウンド母集団の詳細設定オプションにアクセスします。

  8. アクティビティの設定を確認し、ワークフローを保存します。

recommendation-more-help
3ef63344-7f3d-48f9-85ed-02bf569c4fff