방문자 클러스터링

방문자 클러스터링을 사용하면 고객 특성을 활용하여 방문자를 동적으로 분류하고 선택한 데이터 입력을 기반으로 클러스터 세트를 생성할 수 있으므로 고객 분석 및 타깃팅을 위해 비슷한 관심사와 행동을 갖는 그룹을 식별할 수 있습니다.

클러스터링 프로세스

클러스터링 프로세스를 사용하려면 입력으로 사용할 지표 및 차원 요소를 식별해야 하며, 특정 대상 모집단을 선택하여 이러한 요소를 적용하여 지정된 클러스터를 만들 수 있습니다. 클러스터링 프로세스를 실행할 때 시스템은 측정 단위 및 차원 입력을 사용하여 지정된 수의 클러스터에 대한 적절한 초기 중심을 결정합니다. 그런 다음 이 중심들을 K-Means 알고리즘을 적용하기 위한 시작점으로 사용합니다.

  • 초기 중심은 Encopy 클러스터링 패스를 통해 지능적으로 선택됩니다.
  • 데이터 클러스터는 모든 데이터 포인트를 가장 가까운 센터에 연결하여 생성됩니다.
  • 각각의 K 클러스터 평균이 새로운 중심이 됩니다.
  • 이 알고리즘은 컨버전스에 도달할 때까지 2단계와 3단계에서 반복됩니다. 여러 개의 패스를 사용할 수 있습니다.

애널리스트는 Options 메뉴의 Maximum Iterations​을(를) 사용하여 클러스터링 알고리즘에 의해 수행될 최대 반복 횟수를 지정할 수 있습니다. 이 옵션을 설정하면 클러스터 센터의 정확한 수렴을 위해 최대 반복 상한 을 기반으로 클러스터링 프로세스를 보다 빠르게 완료할 수 있습니다.

노트

클러스터가 정의되면 클러스터 Dimension을 다른 차원처럼 사용할 수 있도록 저장할 수 있습니다. 클러스터 탐색기에 로드되어 클러스터 센터의 분리를 검사할 수도 있습니다.

클러스터 빌더에서 클러스터를 정의할 때 Options > Algorithm 을 선택하여 알고리즘을 선택할 수 있습니다. 현재 지원되는 알고리즘은 3가지가 있습니다.

  • KMeans
  • Kmeans++
  • 기대 최대화

클러스터링 프로세스를 실행하는 방법에는 두 가지가 있습니다.

  • 방법 1 - 클러스터 시각화 창에서 Go 을 클릭합니다.
  • 방법 2 - 클러스터 시각화 창에서 Submit​을(를) 클릭하여 클러스터링 작업을 서버에 직접 전송합니다. "질의에 대한 세부 상태" 옵션을 통해 진행 상황을 추적할 수 있습니다.

알고리즘에는 다음과 같은 제한 사항이 있습니다.

  1. 방법 1을 사용하는 경우 지원되는 클러스터링 알고리즘을 선택할 수 있습니다.
  2. 방법 2를 사용하는 경우 kmean 또는 kmeans++ 선택할 수 있습니다. 예상 최대값 옵션을 사용할 수 없습니다.
노트

DPU.cfg 파일에서 'Query, Memory Limit'의 값은 기본적으로 500MB로 설정됩니다. 여러 클러스터링 작업을 실행하는 동안 이 값을 늘려야 합니다. 예를 들어 5개의 클러스터링 작업을 동시에 실행하는 경우 이 값을 1GB로 높입니다. 서버를 다시 시작하지 않으면 클러스터링 작업을 취소할 수 없습니다.

추천 항목

반복 횟수(데이터를 스캔한 횟수) 및 구성하는 융합 임계값은 클러스터링 성능에 크게 영향을 줍니다. 다음 표에는 다음과 같은 광범위한 지침이 제공됩니다.

클러스터 수 알고리즘 반복 융합 임계값 표준화
6 Kmeans 25,50 1e-3 Min-Max
6 Kmeans 25,50 1e-6 Min-Max
6 Kmeans++ 50 1e-6 Min-Max

이 페이지에서는