セグメント比較で使用される統計テスト

上位の比較テーブルのそれぞれには、差異スコアが表示されます。 このスコアは、実行される比較に応じて、いくつかの統計テストによって計算されます。 ただし、どのテストを使用した場合でも、差異スコアは 0 ~ 1 の値として表示されます。

スコアが 0 の場合は、2 つのセグメント間に違いがなく、スコアが 1 の場合は、2 つのセグメント間に非常に大きな違いがあったことを意味します。 これらの差異スコアを生成するために使用される統計テストには、次の 2 つのタイプがあります。

  • 上位指標 テーブルには、Mann-Whitney U テストが使用されます。
  • 上位のDimension項目 および 上位のセグメント テーブルでは、リスク差比較が使用されます。

トップの指標の差異スコア

上位の指標表では、セグメント比較ツールで 2 つのサンプルの Mann-Whitney U テストを使用しています。 このテストは、考慮された各セグメントに対する各指標の 1 次元確率分布を比較するために使用されるノンパラメトリック等価性テストです。 指標テーブルの差異スコアは、計算された U 統計からの p 値(特定の指標全体に分散された 2 つのセグメントが確率的にどのように異なるかを表す)と計測された差異の相対的な大きさの組み合わせです。差異スコアが大きい(1 に近い)場合は、特定の指標に大きな相対差があり、セグメントが異なるという統計的信頼性が高いことを意味します。

上位のディメンション項目と上位のセグメントの差異スコア

上位のディメンション項目および上位のセグメントの差異のテーブルに対する差異スコアを計算するために、相対リスク差アルゴリズムが使用されます(比率でなく差を使用しますが、リスク比に似ています)。リスク差は、選択したセグメントの一方のディメンション項目の累積発生率(またはセグメントのテーブルからのセグメントの重複)を他方から減算することで計算されます。差異スコアが高い(1 に近い)場合、特定のディメンション項目または 3 次セグメントが、選択したいずれかのセグメントで非常に目立ち、他のセグメントでは非常に目立たなかったことを意味します。

NOTE
統計的な正確性を維持しながら可能な限り早く処理を実行するために、3 つすべてのテーブルで、差異統計は訪問者の適切なサンプルに基づいています。差異スコアがサンプルに基づいているのに対して、テーブルに表示される結果は、サンプルではありません。統計的有意性を確保するために、各統計テストは、3 %未満の誤差のサンプルサイズのより小さいセグメントを含むような動的割り当てアルゴリズムを信頼します。セグメントに含まれる訪問者が非常に少ない(1,000 人未満)場合(差異スコアの計算には、サンプルの代わりに、使用可能なすべてのデータを使用します)。
recommendation-more-help
a83f8947-1ec6-4156-b2fc-94b5551b3efc