입력 변수, 클러스터 수 및 대상 모집단(원하는 경우)을 선택하여 데이터 집합에 클러스터를 정의합니다.
클러스터 구축
Cluster Builder.
시각화 > Predictive Analytics > 클러스터링 > 클러스터 빌더를 클릭합니다.
입력 변수를 선택합니다.
도구 모음의 Metric 메뉴에서 를 선택하여 Input Variables 목록에 지표를 추가합니다.
차원 요소를 Dimension 테이블에서 드래그하여 Input Variables 목록에 추가합니다.
Ctrl + Alt 키를 누르고 선택한 차원 요소를 Input Variables 목록 또는 도구 모음의 Element 상자로 드래그합니다.
기본적으로 클러스터링은 전체 데이터 세트에서 수행됩니다. 왼쪽 Preprocessing 창에서 모든 입력 변수를 볼 수 있습니다.
Options 메뉴를 사용하여 원하는 클러스터 수를 선택합니다.
데이터 집합에 있는 방문자 하위 집합을 클러스터링하려는 경우 모집단 필터를 정의할 수 있습니다.
먼저 Workspace에서 선택 사항을 사용하거나 Filter Editor 을 사용하여 원하는 하위 집합을 정의합니다. 원하는 하위 집합을 선택하면 Options 메뉴에서 Target 모집단 을 설정합니다. 타깃팅된 그룹에 식별 이름을 지정하는 것이 좋습니다.
또한 Options 메뉴에는 최대 가공 패스 수 및 센터 컨버전스의 허용 가능한 임계값을 제어하는 설정이 있습니다.
입력 및 옵션이 구성된 후 이동 단추를 클릭하여 클러스터링을 로컬로 실행하거나 Submit 키를 눌러 작업을 Predictive Analytics 서버로 전송합니다. 서버에 제출하면 수렴이 완료되면 결과 차원이 데이터 세트에 저장됩니다.
로컬에서 실행할 때 입력을 기반으로 지능형 센터를 정의하면 클러스터 빌더가 4개의 캐노피 클러스터링 단계를 이동하는 것을 볼 수 있습니다.
클러스터 중심이 지정된 융합 임계값 이상의 변경을 중지하면 클러스터 Dimension이 수렴되고 클러스터 빌더에 각 클러스터에 대한 입력이 어떻게 관련되었는지에 대한 추가 정보가 표시됩니다.
클러스터를 사용자 정의합니다.
통계 색상 막대를 마우스 오른쪽 단추로 클릭하면 관련성 임계값을 사용자 정의할 수 있는 컨텍스트 메뉴가 열리고 차원 요소 배포의 경우 표시되는 테스트를 선택할 수 있습니다.
지표 입력은 각 클러스터에 대한 t-test를 제공하는 반면 차원 요소 입력은 각 클러스터에 대해 세 가지 배포 테스트(카이 제곱, 엔트로피 U 통계 및 Cramer의 V 통계)를 제공합니다.
수렴하는 동안 입력을 추가하거나 제거하면 다시 Go을 누를 때까지 프로세스가 일시 중지됩니다.
클러스터를 작성한 후 색상 선택기를 열어 다른 배포 결과에 대한 색상을 할당할 수 있습니다.
클러스터 Dimension이 수렴되면 테이블에 지표를 추가하고 정상적으로 선택할 수 있습니다. 요소 이름(클러스터 1, 클러스터 2 등)을 마우스 오른쪽 단추로 클릭하여 컨텍스트 메뉴를 열어 의미 있는 이름으로 바꿀 수도 있습니다.
이 클러스터 차원을 다른 시각화에서 사용하려면 로컬에서 Save 사용하거나 Submit 서버에 연결할 수 있습니다.
컨버전스를 다시 실행하거나 입력의 관련성을 확인하려는 경우 Cluster Builder가 기존 클러스터 차원을 로드할 수도 있습니다.
선택한 경우 Reset은(는) 모든 입력 변수를 완전히 해제하고 새 클러스터를 정의하는 빈 클러스터 빌더 시각화를 제공합니다.