통계적 측정

통계에 도움이 되도록, Data Workbench은 안내가 있는 분석 시각화에서 세 가지 통계 측정을 제공합니다.

노트

수학은 데이터의 상관 관계를 판단하는 데 도움이 될 수 있지만 데이터를 둘러싼 컨텍스트 또한 고려해야 합니다.

  • Chi Sq 는 시각화에서 확인 표시의 모양을 제어하는 통계적 중요성의 테스트입니다. 수학적으로, 이것은 우리가 Null 가설을 거부할 수 있는 확률이며, 이것은 두 그룹 사이에 관찰되는 차이가 무작위 변형에 의해 설명될 수 있다는 것을 나타냅니다. 실제로 Chi Sq 값이 거의 100% 미만인 경우, 측정된 강도에 관계없이 상관 관계를 무시할 수 있습니다(다음 U 통계 및 V 통계 섹션에 설명된 대로).
  • U 통계란 통계적 상관관계의 강도를 측정하는 것입니다. 수학적으로, 그것은 정보 이론이라고 불리는 수학의 분기에서 나오고, 두 그룹의 분포들 사이의 상호 정보의 개념과 밀접한 관련이 있다. 또는 다른 그룹에 대해 최적의 코딩 방식을 사용하면 한 그룹의 압축성으로 생각할 수 있습니다. 실제로 이 측정은 방문자가 적은 많은 요소가 있는 차원의 일반적인 경우에 매우 잘 수행됩니다. 이 측정은 0(약함)부터 1(강함)까지 달라집니다.
  • V 통계도 통계적 상관성의 강도지표다. 수학적으로, 이것은 선택 전환과 관련하여 측정의 대칭성을 향상시키기 위한 정규화 단계로만 달라지는 친숙한 Cramer의 V 통계와 관련되어 있습니다. 사실상, 이 측정은 많은 유형의 차원에서 상당히 잘 작동하며 일반적으로 사용되는 통계 측정과 관련되어 있습니다. 이 측정은 0(약함)부터 1(강함)까지 달라집니다.
노트

서로 보완하기 위해 U와 V 통계가 선택되었습니다. 각각 다른 U와 V가 강력하게 응답하지 않을 수 있는 상관 관계 유형을 감지하기 위해 조정되었습니다.

이 시각화를 안내서로 사용하면 작업 공간에 다른 시각화를 추가하여 선택 사항을 기반으로 데이터에 대한 자세한 통찰력을 제공할 수 있습니다.

다음 Site 예에는 1월, 2월, 3월 및 4월의 일 세션을 보여주는 막대 그래프가 포함되어 있습니다. 1월의 하루는 선택되어 있습니다.

작업 공간의 왼쪽 아래 모서리에 있는 안내가 있는 분석 시각화는 세션 번호 차원이 선택한 날짜에 대한 유용한 정보를 제공함을 나타냅니다.

작업 공간의 오른쪽 아래 모서리에 있는 세션 번호 막대 그래프를 조사하면 세션 번호 2에 대한 데이터가 벤치마크보다 훨씬 낮음을 확인할 수 있습니다. 따라서, 백분율로, 선택한 날에 평소보다 더 적은 두 번째 세션이 발생했음을 결론지을 수 있습니다. 안내가 있는 분석 시각화에 나열된 모든 차원에 대한 막대 그래프를 보려면 마우스를 사용하여 차원을 클릭하여 선택하기만 하면 됩니다.

이 페이지에서는