区段比较中使用的统计测试

每个排名最前的比较表都会显示差异分数。 该得分由若干统计测试根据所做的比较来计算。 但是,无论使用哪种测试,差异分数都显示为0到1之间的值。

0分表示两个区段之间没有差异,1分表示两个区段之间存在很大差异。 有两种类型的统计测试用于生成这些差异分数:

  • 对于​ 热门量度 ​表,使用Mann-Whitney U测试,
  • 对于​ 排名最前的Dimension项目 ​和​ 排名最前的区段 ​表,使用风险差异比较。

热门量度差异分数

在“顶级量度”表中,区段比较工具使用两个示例Mann-Whitney U测试。 此测试为非参数等式测试,用于比较每个指标对所考虑区段的一维概率分布。 量度表中的差异分数是一个综合分数,包括来自计算的 U 统计量的 P 值(表示两个区段在特定量度中随机分布的差异程度)和所观察到差异的相对大小。大差异分数(接近1)意味着特定量度具有大的相对差异,并且对于区段不同的统计置信度很高。

主要维度项目和排名最前的区段差异分数

要计算主要维度项目和排名最前的区段差异表上的差异分数,请使用相对风险差异算法(与风险比率类似,只是使用差异分数取代了比率)。风险差异的计算方法是从其他区段减去某个选定区段中维度项目(或与区段表中某个区段的重叠)的累积发生率。高差异分数(接近1)意味着特定维度项目或第三区段在一个选定区段中非常突出,而在另一个区段中不是非常突出。

NOTE
在所有三个表中,差异统计都基于适当的访客取样,这样既可以尽可能快速地运行统计过程,又可以保持统计学上的准确性。虽然差异分数基于取样,但不会对表中显示的结果进行取样。为了确保统计显著性,每个统计测试都依赖于一个动态分配算法,以便较小的区段能够包含误差范围小于 3% 的取样大小。如果区段包含非常少的访客(少于1,000),则使用所有可用数据而不是样本来计算差异分数。
recommendation-more-help
a83f8947-1ec6-4156-b2fc-94b5551b3efc