ID 최적화 알고리즘 identity-optimization-algorithm

ID 최적화 알고리즘은 ID 그래프가 한 사람을 나타내도록 도와주며, 따라서 실시간 고객 프로필에서 원치 않는 ID의 병합을 방지하는 ID 서비스에 대한 그래프 알고리즘입니다.

입력 매개 변수 input-parameters

고유한 네임스페이스 및 네임스페이스 우선 순위에 대한 자세한 내용은 이 섹션을 참조하십시오. 이 두 개념은 ID 최적화 알고리즘에서 요구하는 입력 매개 변수 역할을 합니다.

고유한 네임스페이스 unique-namespace

고유한 네임스페이스는 그래프 축소가 발생할 경우 제거되는 링크를 결정합니다.

병합된 단일 프로필 및 해당 ID 그래프는 단일 개인(개인 엔티티)을 나타내야 합니다. 일반적으로 단일 개인은 CRMID 및/또는 로그인 ID로 표시됩니다. 예상은 두 개인(CRMID)이 하나의 프로필 또는 그래프로 병합되지 않는다는 것입니다.

ID 최적화 알고리즘을 사용하여 ID 서비스에서 개인 엔티티를 나타내는 네임스페이스를 지정해야 합니다. 예를 들어 CRM 데이터베이스가 단일 CRMID 및 단일 이메일 주소와 연결할 사용자 계정을 정의하는 경우 이 샌드박스의 ID 설정은 다음과 같습니다.

  • CRMID 네임스페이스 = 고유
  • 이메일 네임스페이스 = 고유

고유하게 선언하는 네임스페이스는 지정된 ID 그래프 내에서 최대 한도 1을 갖도록 자동으로 구성됩니다. 예를 들어 CRMID 네임스페이스를 고유한 것으로 선언하는 경우 ID 그래프는 CRMID 네임스페이스가 포함된 ID를 하나만 가질 수 있습니다. 네임스페이스를 고유하게 선언하지 않으면 해당 네임스페이스와 함께 그래프에 둘 이상의 ID가 포함될 수 있습니다.

NOTE
  • 가구 엔티티 표시("가구 그래프")는 현재 지원되지 않습니다.

  • 개인 식별자이며 샌드박스에서 ID 그래프를 생성하는 데 사용되는 모든 네임스페이스는 고유 네임스페이스로 표시되어야 합니다. 그렇지 않으면 원하지 않는 연결 결과가 표시될 수 있습니다.

네임스페이스 우선순위 namespace-priority

네임스페이스 우선 순위는 ID 최적화 알고리즘이 링크를 제거하는 방법을 결정합니다.

ID 서비스의 네임스페이스에는 암시적 상대적 중요도 순서가 있습니다. 피라미드처럼 구성된 그래프를 생각해 보자. 맨 위 층에 1개의 노드가 있고, 가운데 층에 2개의 노드가 있으며, 맨 아래 층에 4개의 노드가 있다. 네임스페이스 우선 순위는 개인 엔티티가 정확하게 표현되도록 이러한 상대적 순서를 반영해야 합니다.

네임스페이스 우선 순위와 전체 기능 및 사용에 대한 자세한 내용은 네임스페이스 우선 순위 가이드를 참조하십시오.

그래프 레이어 및 네임스페이스 우선 순위입니다. {modal="regular"}

프로세스 process

새 ID를 수집하면 ID 서비스는 새 ID와 해당 네임스페이스가 고유한 네임스페이스 구성을 준수하는지 확인합니다. 구성을 따르는 경우 수집이 진행되고 새 ID가 그래프에 연결됩니다. 그러나 구성을 따르지 않으면 ID 최적화 알고리즘이 다음을 수행합니다.

  • 네임스페이스 우선 순위를 고려하여 가장 최근의 이벤트를 수집합니다.
  • 적절한 그래프 레이어에서 두 개의 개인 엔티티를 병합하는 링크를 제거합니다.

ID 최적화 알고리즘 세부 정보

고유한 네임스페이스 제한 사항을 위반하면 ID 최적화 알고리즘이 링크를 "다시 재생"하고 그래프를 처음부터 다시 빌드합니다.

  • 링크는 다음 순서로 정렬됩니다.

    • 최신 이벤트.
    • 네임스페이스 우선 순위 합계별 타임스탬프(낮은 합계 = 높은 순서).
  • 위 순서에 따라 그래프가 다시 설정됩니다. 링크를 추가하는 것이 제한 제한을 위반하는 경우(예: 그래프에 고유한 네임스페이스가 있는 두 개 이상의 ID가 포함됨) 링크가 제거됩니다.

  • 그러면 결과 그래프는 사용자가 구성한 고유한 네임스페이스 제약 조건을 준수합니다.

ID 최적화 알고리즘을 시각화하는 다이어그램입니다. {modal="regular"}

ID 최적화 알고리즘에 대한 예제 시나리오

다음 섹션에서는 공유 디바이스 또는 동일한 타임스탬프를 사용하는 데이터 수집과 같은 시나리오에서 ID 최적화 알고리즘이 작동하는 방식을 간략하게 설명합니다.

공유 디바이스

공유 디바이스는 둘 이상의 개인이 사용하는 디바이스를 의미합니다. 예를 들어, 공유 장치는 파트너 또는 가족 구성원, 라이브러리 컴퓨터 또는 공용 키오스크와 공유하는 랩톱 또는 태블릿일 수 있습니다.

예제
table 0-row-2 1-row-2 2-row-2 3-row-2
네임스페이스 고유한 네임스페이스
CRMID
이메일
ECID 아니요

이 예에서는 CRMID와 이메일이 모두 고유한 네임스페이스로 지정됩니다. timestamp=0에서 고유한 네임스페이스 구성으로 인해 CRM 레코드 데이터 세트가 수집되고 두 개의 다른 그래프를 만듭니다. 각 그래프는 CRMID 및 이메일 네임스페이스를 포함합니다.

  • timestamp=1: Jane이 노트북을 사용하여 전자 상거래 웹 사이트에 로그인합니다. Jane은 CRMID와 Email로 나타내고, Jane이 사용하는 노트북의 웹 브라우저는 ECID로 나타냅니다.
  • timestamp=2: John이 동일한 노트북을 사용하여 전자 상거래 웹 사이트에 로그인합니다. John은 CRMID 및 이메일로 나타내고, 그가 사용한 웹 브라우저는 이미 ECID로 표시됩니다. 동일한 ECID가 두 개의 다른 그래프에 연결되어 있으므로 ID 서비스는 이 장치(랩톱)가 공유 장치임을 알 수 있습니다.
  • 그러나 그래프당 최대 하나의 CRMID 네임스페이스와 하나의 이메일 네임스페이스를 설정하는 고유한 네임스페이스 구성으로 인해 ID 최적화 알고리즘은 그래프를 두 개로 분할합니다.
    • 마지막으로 John은 인증된 마지막 사용자이므로 노트북을 나타내는 ECID가 Jane이 아닌 자신의 그래프에 연결된 상태로 유지됩니다.

공유 장치 중 하나 사례. {modal="regular"}

예제 2
table 0-row-2 1-row-2 2-row-2
네임스페이스 고유한 네임스페이스
CRMID
ECID 아니요

이 예에서 CRMID 네임스페이스는 고유한 네임스페이스로 지정됩니다.

  • timestamp=1: Jane이 노트북을 사용하여 전자 상거래 웹 사이트에 로그인합니다. 그녀는 CRMID로 표시되며, 랩톱의 웹 브라우저는 ECID로 표시됩니다.

  • timestamp=2: John이 동일한 노트북을 사용하여 전자 상거래 웹 사이트에 로그인합니다. 그는 CRMID로 표시되며, 그가 사용하는 웹 브라우저는 동일한 ECID로 표시됩니다.

    • 이 이벤트는 두 개의 독립 CRMID를 동일한 ECID에 연결하며, 이는 구성된 한 CRMID 제한을 초과합니다.
    • 따라서 ID 최적화 알고리즘에서는 이전 링크를 제거합니다. 이 경우 이 링크는 timestamp=1에 연결된 Jane의 CRMID입니다.
    • 그러나 Jane의 CRMID는 더 이상 ID 서비스에 대한 그래프로 존재하지 않지만 실시간 고객 프로필에는 프로필로 유지됩니다. ID 그래프에는 최소 2개의 연결된 ID가 포함되어야 하며 링크가 제거됨에 따라 Jane의 CRMID에 더 이상 연결할 다른 ID가 없기 때문입니다.

공유 장치의 사례 2입니다. {modal="regular"}

잘못된 이메일

사용자가 이메일 및/또는 전화번호에 대해 잘못된 값을 입력할 수 있는 경우가 있습니다.

네임스페이스
고유한 네임스페이스
CRMID
이메일
ECID
아니요

이 예에서 CRMID 및 이메일 네임스페이스는 고유으로 지정됩니다. Jane과 John이 잘못된 이메일 값을 사용하여 전자 상거래 웹 사이트에 등록한 시나리오를 고려하십시오(예: test@test.com).

  • timestamp=1: Jane이 iPhone에서 Safari를 사용하여 전자 상거래 웹 사이트에 로그인하여 CRMID(로그인 정보) 및 ECID(브라우저)를 설정합니다.

  • timestamp=2: John이 iPhone에서 Google Chrome을 사용하여 전자 상거래 웹 사이트에 로그인하여 CRMID(로그인 정보) 및 ECID(브라우저)를 설정합니다.

  • timestamp=3: 데이터 엔지니어가 Jane의 CRM 레코드를 수집하므로 CRMID가 잘못된 전자 메일에 연결됩니다.

  • timestamp=4: 데이터 엔지니어가 John의 CRM 레코드를 수집하므로 CRMID가 잘못된 전자 메일에 연결됩니다.

    • 그러면 두 개의 CRMID 네임스페이스가 있는 단일 그래프를 만들기 때문에 고유한 네임스페이스 구성을 위반하게 됩니다.
    • 그 결과 ID 최적화 알고리즘에서 이전 링크를 삭제합니다. 이 경우 CRMID 네임스페이스가 있는 Jane의 ID와 테스트이(가) 있는 ID 간의 @test.

ID 최적화 알고리즘을 사용하면 잘못된 이메일 또는 전화번호와 같은 잘못된 ID 값이 여러 다른 ID 그래프에 전파되지 않습니다.

잘못된 전자 메일 수집 다이어그램입니다. {modal="regular"}

익명 이벤트 연결

ECID는 인증되지 않은(익명) 이벤트를 저장하는 반면 CRMID는 인증된 이벤트를 저장합니다. 공유 장치의 경우 ECID(인증되지 않은 이벤트의 전달자)가 마지막으로 인증된 사용자 ​와 연결됩니다.

익명 이벤트 연결의 작동 방식을 더 잘 이해하려면 아래 다이어그램을 보십시오.

  • 케빈과 노라가 한 알씩 나눠 먹는다.

    • timestamp=1: Kevin이 계정을 사용하여 전자 상거래 웹 사이트에 로그인하여 CRMID(로그인 정보)와 ECID(브라우저)를 설정합니다. 이제 로그인 시 Kevin은 마지막으로 인증된 사용자로 간주됩니다.

    • timestamp=2: Nora는 계정을 사용하여 전자 상거래 웹 사이트에 로그인하여 CRMID(로그인 정보) 및 동일한 ECID를 설정합니다. 로그인 시 Nora는 이제 마지막으로 인증된 사용자로 간주됩니다.

    • timestamp=3: Kevin은 태블릿을 사용하여 전자 상거래 웹 사이트를 검색하지만 자신의 계정으로 로그인하지 않습니다. 그런 다음 Kevin의 검색 활동은 ECID에 저장되며, 이는 Nora가 마지막으로 인증된 사용자이기 때문에 Nora와 연결됩니다. 이 시점에서 노라는 익명의 사건을 소유한다.

      • Kevin이 다시 로그인할 때까지 Nora의 병합된 프로필은 ECID에 대해 저장된 인증되지 않은 모든 이벤트와 연결됩니다(이벤트는 ECID가 기본 ID인 경우).
    • timestamp=4: Kevin이 다시 로그인합니다. 이 시점에서 다시 한 번 마지막으로 인증된 사용자가 되며 이제 인증되지 않은 이벤트도 소유합니다.

      • timestamp=1 이전에 처음 로그인하기 전
      • 케빈의 첫 번째 로그인과 두 번째 로그인 사이에 익명으로 탐색하는 동안 그와 노라가 했던 모든 활동.

익명 이벤트 연결의 다이어그램입니다. {modal="regular"}

다음 단계

Identity Graph Linking Rules에 대한 자세한 내용은 다음 설명서를 참조하십시오.

recommendation-more-help
64963e2a-9d60-4eec-9930-af5aa025f5ea