Chi Sq p 是统计显著性测试,它控制可视化中复选标记的出现。从数学上讲,我们有可能会拒绝零假设,该假设认为在两个组之间观察到的差别可以由随机变差来解释。实际上,如果 Chi Sq p 值差不多小于 100%,我们就可以忽略相关性,而不管它测量的相关程度如何(如以下 U 统计量和 V 统计量部分所述)。
U 统计量是统计相关性相关程度的指标。从数学上讲,它来自信息理论这一数学分支,与两个组的分布之间的交互信息概念紧密相关。或者,也可以将其认为是为一个组提供最佳编码方案的另一个组的可压缩性。实际上,该指标在维度具有包含很少访客的很多元素时通常执行得不错。该指标在 0(弱)到 1(强)之间变化。
V 统计量也是统计相关性相关程度的指标。从数学上讲,它与我们熟悉的 Cramer’s V 统计量有关,唯一的差别是为了提高该指标关于选择倒置的对称性而进行的一个标准化步骤。实际上,该指标非常适合很多类型的维度并且与常用的统计指标有关。该指标在 0(弱)到 1(强)之间变化。