ID 最適化アルゴリズム identity-optimization-algorithm
ID最適化アルゴリズムは、ID グラフが1人の個人を表すことを確認するのに役立つID サービス上のグラフアルゴリズムです。したがって、リアルタイム顧客プロファイル上のIDの不要な結合を防ぐことができます。
入力パラメーター input-parameters
一意の名前空間と名前空間の優先度について詳しくは、この節を参照してください。 これらの2つの概念は、ID最適化アルゴリズムで必要な入力パラメーターとして機能します。
一意の名前空間 unique-namespace
一意の名前空間は、グラフの折りたたみが発生した場合に削除されるリンクを決定します。
単一の結合プロファイルとそれに対応するID グラフは、単一の個人(人物エンティティ)を表す必要があります。 通常、個人はCRMIDやログイン IDで表されます。 2つの個人(CRMID)が1つのプロファイルまたはグラフに統合されることはありません。
ID最適化アルゴリズムを使用して、ID サービス内の個人エンティティを表す名前空間を指定する必要があります。 例えば、CRM データベースが1つのCRMIDと1つの電子メールアドレスに関連付けるユーザーアカウントを定義する場合、このサンドボックスのID設定は次のようになります。
- CRMID名前空間=一意
- メール名前空間=一意
一意であると宣言した名前空間は、特定のID グラフ内で最大数の1に設定されるように自動的に設定されます。 例えば、CRMID名前空間を一意として宣言する場合、ID グラフにはCRMID名前空間を含むIDを1つだけ含めることができます。 名前空間を一意に宣言しない場合、グラフには、その名前空間を持つ複数のIDを含めることができます。
-
世帯エンティティの表示(「世帯グラフ」)は、現時点ではサポートされていません。
-
個人IDであり、サンドボックスでID グラフを生成するために使用されるすべての名前空間は、一意の名前空間としてマークする必要があります。 それ以外の場合は、望ましくないリンク結果が表示される可能性があります。
名前空間の優先度 namespace-priority
名前空間優先度は、ID最適化アルゴリズムがリンクを削除する方法を決定します。
ID サービスの名前空間には、重要度の暗黙的な相対的な順序があります。 ピラミッドのような構造のグラフを考えてみましょう。 最上位レイヤーには1つのノード、中間レイヤーには2つのノード、最下位レイヤーには4つのノードがあります。 人物エンティティが正確に表現されるように、名前空間の優先順位はこの相対的な順序を反映する必要があります。
名前空間の優先度とその完全な機能と用途について詳しくは、名前空間優先度ガイド を参照してください。
プロセス process
ID サービスは、新しいIDを取り込む際に、新しいIDとそれに対応する名前空間が一意の名前空間設定に準拠しているかどうかを確認します。 設定に従うと、取り込みが進み、新しいIDがグラフにリンクされます。 ただし、設定に従わない場合、ID最適化アルゴリズムは次のようになります。
- 名前空間の優先順位を考慮しながら、最新のイベントを取り込みます。
- 適切なグラフレイヤーから2人のエンティティを結合するリンクを削除します。
ID最適化アルゴリズムの詳細
一意の名前空間制約に違反すると、ID最適化アルゴリズムはリンクを「再再生」し、グラフをゼロから再構築します。
-
リンクは、次の順序で並べ替えられます。
- 最新のイベント。
- 名前空間の優先度の合計によるタイムスタンプ(低い合計=高い順序)。
-
グラフは上記の順序に基づいて再確立されます。 リンクを追加すると、制限の制約に違反する場合(例えば、グラフに一意の名前空間を持つ2つ以上のIDが含まれている場合)、リンクは削除されます。
-
作成されたグラフは、設定した一意の名前空間制約に準拠します。
ID最適化アルゴリズムのシナリオ例
次の節では、同じタイムスタンプを持つ共有デバイスやデータの取り込みなどのシナリオで、ID最適化アルゴリズムがどのように動作するかを説明します。
共有デバイス
共有デバイスとは、複数の個人が使用するデバイスを指します。 例えば、共有デバイスは、パートナーや家族、ライブラリコンピューター、またはパブリックキオスクと共有するラップトップまたはタブレットです。
| table 0-row-2 1-row-2 2-row-2 3-row-2 | |
|---|---|
| 名前空間 | 一意の名前空間 |
| CRMID | ○ |
| メール | ○ |
| ECID | × |
この例では、CRMIDと電子メールの両方が一意の名前空間として指定されています。 timestamp=0で、一意の名前空間設定により、CRM レコードデータセットが取り込まれ、2つの異なるグラフが作成されます。 各グラフには、CRMIDとメール名前空間が含まれます。
timestamp=1: Janeはラップトップを使用してe コマース web サイトにログインします。 JaneはCRMIDと電子メールで表され、彼女が使用するノートパソコンのweb ブラウザーはECIDで表されます。timestamp=2: Johnは、同じラップトップを使用してe コマース web サイトにログインします。 JohnはCRMIDとEmailで表され、彼が使用したweb ブラウザーは既にECIDで表されています。 同じECIDが2つの異なるグラフにリンクされているため、ID サービスはこのデバイス(ラップトップ)が共有デバイスであることを知ることができます。- ただし、一意の名前空間設定により、グラフごとに最大1つのCRMID名前空間と1つのメール名前空間を設定するため、ID最適化アルゴリズムはグラフを2つに分割します。
- 最後に、Johnが最後に認証されたユーザーであるため、ラップトップを表すECIDは、Janeの代わりに彼のグラフにリンクされたままです。
| table 0-row-2 1-row-2 2-row-2 | |
|---|---|
| 名前空間 | 一意の名前空間 |
| CRMID | ○ |
| ECID | × |
この例では、CRMID名前空間は一意の名前空間として指定されます。
-
timestamp=1: Janeはラップトップを使用してe コマース web サイトにログインします。 CRMIDが彼女を表し、ラップトップのweb ブラウザーはECIDで表されます。 -
timestamp=2: Johnは、同じラップトップを使用してe コマース web サイトにログインします。 彼は彼のCRMIDによって表され、彼が使用するweb ブラウザは同じECIDによって表されます。- このイベントは、2つの独立したCRMIDを同じECIDにリンクし、1つのCRMIDの設定制限を超えています。
- その結果、ID最適化アルゴリズムは古いリンクを削除します。この場合は、
timestamp=1にリンクされたJaneのCRMIDです。 - JaneのCRMIDは、ID サービス上のグラフとしては存在しませんが、リアルタイム顧客プロファイル上のプロファイルとして残ります。 これは、ID グラフに少なくとも2つのリンク IDが含まれている必要があり、リンクを削除した結果、JaneのCRMIDにリンクする別のIDがなくなったためです。
不正なメール
ユーザーがメールや電話番号に不正な値を入力する場合があります。
この例では、CRMIDとメールの名前空間は一意として指定されています。 JaneとJohnが不正な電子メール値を使用してe コマースサイトにサインアップした場合のシナリオを考えてみましょう(例:test@test.com)。
-
timestamp=1: Janeは、iPhoneでSafariを使用してe コマースサイトにログインし、CRMID (ログイン情報)とECID (ブラウザー)を設定します。 -
timestamp=2: Johnは、iPhoneでGoogle Chromeを使用してe コマース web サイトにログインし、CRMID (ログイン情報)とECID (ブラウザー)を設定します。 -
timestamp=3: データエンジニアがJaneのCRM レコードを取り込みます。これにより、JaneのCRMIDが不正な電子メールにリンクされます。 -
timestamp=4: データエンジニアがJohnのCRM レコードを取り込みます。これにより、JohnのCRMIDが不正な電子メールにリンクされます。- これは、2つのCRMID名前空間を持つ単一のグラフを作成するため、一意の名前空間設定に違反します。
- その結果、ID最適化アルゴリズムは古いリンクを削除します。この場合、JaneのIDとCRMID名前空間の間のリンクと、test@testのIDの間のリンクです。
ID最適化アルゴリズムでは、偽の電子メールや電話番号などの不正なID値が、複数の異なるID グラフに反映されません。
匿名イベントの関連付け
ECIDは未認証(匿名)イベントを保存し、CRMIDは認証済みイベントを保存します。 共有デバイスの場合、ECID (未認証イベントのベアラー)は、最後に認証されたユーザーに関連付けられます。
匿名イベントの関連付けがどのように機能するかについては、次の図を参照してください。
-
ケビンとノラはタブレットを共有している。
-
timestamp=1: Kevinは自分のアカウントを使用してe コマース web サイトにログインし、CRMID (ログイン情報)とECID (ブラウザー)を確立します。 ログイン時に、Kevinは最後に認証されたユーザーと見なされます。 -
timestamp=2: Noraはアカウントを使用してe コマース web サイトにログインし、CRMID (ログイン情報)と同じECIDを確立します。 ログイン時に、Noraは最後に認証されたユーザーと見なされます。 -
timestamp=3: Kevinはタブレットを使用してe コマース web サイトを閲覧しますが、アカウントでログインしません。 その後、Kevinの閲覧活動はECIDに保存され、これは彼女が最後に認証されたユーザーであるため、Noraに関連付けられます。 この時点で、Noraは匿名イベントを所有しています。- Kevinが再度ログインするまで、Noraの結合プロファイルは、ECIDに対して保存されているすべての未認証イベントに関連付けられます(イベントはECIDがプライマリ IDである場合)。
-
timestamp=4: Kevinは2回目ログインします。 この時点で、彼は再び最後の認証済みユーザーになり、未認証のイベントも所有します。timestamp=1以前の最初のログイン前- Kevinの1回目と2回目のログインの間に匿名で閲覧した際に、彼またはNoraが行ったアクティビティ。
-
次の手順
Identity Graph Linking Rulesについて詳しくは、次のドキュメントを参照してください。