클러스터 구축

입력 변수, 클러스터 수 및 대상 모집단(원하는 경우)을 선택하여 데이터 집합에 클러스터를 정의합니다.

클러스터 구축

  1. Cluster Builder.

    시각화 > Predictive Analytics > 클러스터링 > 클러스터 빌더​를 클릭합니다.

  2. 입력 변수를 선택합니다.

    • 도구 모음의 Metric 메뉴에서 를 선택하여 Input Variables 목록에 지표를 추가합니다.

    • 차원 요소를 Dimension 테이블에서 드래그하여 Input Variables 목록에 추가합니다.

      Ctrl + Alt 키를 누르고 선택한 차원 요소를 Input Variables 목록 또는 도구 모음의 Element 상자로 드래그합니다.


      기본적으로 클러스터링은 전체 데이터 세트에서 수행됩니다. 왼쪽 Preprocessing 창에서 모든 입력 변수를 볼 수 있습니다.

  3. Options 메뉴를 사용하여 원하는 클러스터 수를 선택합니다.

  4. 데이터 집합에 있는 방문자 하위 집합을 클러스터링하려는 경우 모집단 필터를 정의할 수 있습니다.

    먼저 Workspace에서 선택 사항을 사용하거나 Filter Editor 을 사용하여 원하는 하위 집합을 정의합니다. 원하는 하위 집합을 선택하면 Options 메뉴에서 Target 모집단 을 설정합니다. 타깃팅된 그룹에 식별 이름을 지정하는 것이 좋습니다.

    또한 Options 메뉴에는 최대 가공 패스 수 및 센터 컨버전스의 허용 가능한 임계값을 제어하는 설정이 있습니다.

  5. 입력 및 옵션이 구성된 후 이동 단추를 클릭하여 클러스터링을 로컬로 실행하거나 Submit 키를 눌러 작업을 Predictive Analytics 서버로 전송합니다. 서버에 제출하면 수렴이 완료되면 결과 차원이 데이터 세트에 저장됩니다.

    로컬에서 실행할 때 입력을 기반으로 지능형 센터를 정의하면 클러스터 빌더가 4개의 캐노피 클러스터링 단계를 이동하는 것을 볼 수 있습니다.

    클러스터 중심이 지정된 융합 임계값 이상의 변경을 중지하면 클러스터 Dimension이 수렴되고 클러스터 빌더에 각 클러스터에 대한 입력이 어떻게 관련되었는지에 대한 추가 정보가 표시됩니다.

  6. 클러스터를 사용자 정의합니다.

    통계 색상 막대를 마우스 오른쪽 단추로 클릭하면 관련성 임계값을 사용자 정의할 수 있는 컨텍스트 메뉴가 열리고 차원 요소 배포의 경우 표시되는 테스트를 선택할 수 있습니다.

    지표 입력은 각 클러스터에 대한 t-test를 제공하는 반면 차원 요소 입력은 각 클러스터에 대해 세 가지 배포 테스트(카이 제곱, 엔트로피 U 통계 및 Cramer의 V 통계)를 제공합니다.

    노트

    수렴하는 동안 입력을 추가하거나 제거하면 다시 Go​을 누를 때까지 프로세스가 일시 중지됩니다.

    클러스터를 작성한 후 색상 선택기를 열어 다른 배포 결과에 대한 색상을 할당할 수 있습니다.

  7. 클러스터 Dimension이 수렴되면 테이블에 지표를 추가하고 정상적으로 선택할 수 있습니다. 요소 이름(클러스터 1, 클러스터 2 등)을 마우스 오른쪽 단추로 클릭하여 컨텍스트 메뉴를 열어 의미 있는 이름으로 바꿀 수도 있습니다.

  8. 이 클러스터 차원을 다른 시각화에서 사용하려면 로컬에서 Save 사용하거나 Submit 서버에 연결할 수 있습니다.

컨버전스를 다시 실행하거나 입력의 관련성을 확인하려는 경우 Cluster Builder가 기존 클러스터 차원을 로드할 수도 있습니다.

선택한 경우 Reset​은(는) 모든 입력 변수를 완전히 해제하고 새 클러스터를 정의하는 빈 클러스터 빌더 시각화를 제공합니다.

이 페이지에서는