Cálculos estatísticos em testes A/Bn

Este artigo documenta os cálculos estatísticos detalhados usados em testes A/Bn manuais no Adobe Target. As definições são fornecidas para Conversion Rate, Confidence Interval of Conversion Rate, Lift, Confidence Interval for Lift e Confidence.

NOTE
As informações deste artigo substituem o arquivo PDF Cálculos do Adobe Target para Teste A/B, que estava disponível anteriormente para download neste site.

Relatório de direcionamento mostrando o Conversion Rate, Average Lift and Confidence Interval, e Confidence de uma atividade de Teste A/B.

Desempenho médio

A seção a seguir explica os cálculos usados na ilustração anterior.

Taxa de conversão e Campanhas de receita por visitante (RPV)

A ilustração a seguir mostra Conversion Rate, Confidence Interval of Conversion Rate e o número de Conversions em um relatório Target. Por exemplo, a primeira linha mostra que para a Experiência A: o Conversion Rate é 25,81% com um Confidence Interval de ±7,7% e 32 conversões foram registradas. Considerando que 124 visitantes visualizaram a experiência, isso equivale a 32/124 = 25,81%.

{width="25%"}

A taxa de conversão ou a média, μν, para cada experiência ν em um experimento é definida como uma proporção da soma da métrica em relação ao número de unidades atribuídas a essa métrica, Nν:

{width="125px"}

Aqui,

  • Yiewer é o valor da métrica para cada unidade i atribuída a uma determinada experiência ν.

  • A soma sobre as unidades i depende da escolha da metodologia de contagem.

    • Se Visitors for usada como a metodologia de contagem, cada unidade será um visitante único definido como um participante único na atividade durante toda a vida útil da atividade.
    • Se Visits for usada como metodologia de contagem, cada unidade será uma visita única definida como um participante único em uma experiência durante uma sessão Target (com um único sessionId). Quando o sessionId é alterado ou o visitante atinge a etapa de conversão, uma nova visita é contada.
    • Se Activity Impressions for usada como a metodologia de contagem, cada unidade será uma impressão exclusiva definida sempre que um visitante carregar qualquer página da atividade.

Confidence Interval of Mean/Conversion Rate

O intervalo de confiança da taxa de conversão é intuitivamente definido como um intervalo de taxas de conversão possíveis consistente com os dados subjacentes.

Ao executar experimentos, o índice de conversão para uma determinada experiência é uma estimativa do índice de conversão "verdadeiro". Para quantificar a incerteza nesta estimativa, Target usa um intervalo de confiança. Target sempre relata um intervalo de confiança de 95%, o que significa que, no final, 95% dos intervalos de confiança calculados incluem o verdadeiro índice de conversão da experiência.

Um intervalo de confiança de 95% da taxa de conversão μν é definido como o intervalo de valores:

{width="30%"}

Quando o erro-padrão da média é definido como

{width="75px"}

Se for utilizada uma estimativa imparcial do desvio-padrão da amostra:

{width="200px"}

Quando a campanha é uma campanha de taxa de conversão (ou seja, a métrica de conversão é binária), o erro padrão se reduz a:

{width="150px"}

Aumento

A ilustração a seguir mostra Lift e Confidence Interval of Lift em um Relatório Target. O número representa a média do intervalo dos limites de aumento, e a seta reflete se o aumento é positivo ou negativo. A seta é exibida em cinza até que a confiança passe de 95%. Depois que a confiança ultrapassa o limite, a seta é verde ou vermelha com base em um aumento positivo ou negativo.

{width="35%"}

O aumento entre uma experiência ν e a experiência de controle ν0 é o "delta" relativo em taxas de conversão, definido como

{width="15%"}

Em que as taxas de conversão individuais são as definidas acima. De maneira mais simples,

Lift(Experience N) = (Performance_Experience_N - Performance_Control)/ Performance_Control

Se o índice de conversão da experiência de controle ν0 for 0, não haverá aumento.

Confidence Interval of Lift

O gráfico boxplot na coluna Average Lift and Confidence Interval representa o valor médio e 95% Confidence Interval of Lift. O boxplot é cinza quando há qualquer sobreposição no intervalo de confiança de uma determinada experiência de não controle com o intervalo de confiança da experiência de controle. O boxplot é verde ou vermelho quando o intervalo de confiança da experiência é acima ou abaixo do intervalo de confiança da experiência de controle.

O erro padrão do aumento entre uma experiência ν e a experiência de controle ν0 é definido como:

metric-average {width="35%"}

Em seguida, o Intervalo de confiança de 95% do aumento é:

{width="40%"}

Este cálculo usa o método "Delta" e é descrito com mais detalhes neste documento

Confidence

A última coluna mostra a confiança em um relatório Target. A confiança de uma experiência é uma probabilidade (denotada como uma porcentagem) de obter um resultado tão extremo quanto o observado, dada a hipótese nula ser verdadeira. Em termos de valores p, a confiança exibida é de 1 - valor p. Intuitivamente, maior confiança significa que é menos provável que a experiência de controle e não controle tenha taxas de conversão iguais.

Em Target, um teste t de Welch de duas caudas é executado entre a experiência de teste e a experiência de controle para testar se os meios de experiências de teste e controle são os mesmos. Como geralmente não sabemos se os tamanhos e as variações de amostra de dois grupos são os mesmos antes de executar o experimento, e o Target também permite que porcentagens desiguais de tráfego sejam enviadas para cada experiência, não pressupomos que a variação de cada experiência seja igual. Assim, o teste t de Welch é escolhido em vez do teste t de Student.

Para executar o teste t de Welch, primeiro começamos a calcular a estatística t e os graus de liberdade, em seguida, executamos um teste t de duas caudas para gerar o valor p. Por fim, calculamos a confiança com base no valor p.

A estatística t é definida como a diferença entre as médias de quaisquer duas variáveis aleatórias independentes, ν e ν0, dividida pelo erro padrão da diferença:

{width="100px"}

Onde μv e μv0 são os meios de ν e ν0{10 μ{12 μ, respectivamente, e o erro padrão da diferença entre ​µ}v e ​µ}v0 é dado por:

{width="150px"}

Onde σ2v e σ2v0 são as variações de duas experiências ν e ν0{13 ν{22 ν0, respectivamente, e Nv e Nv0 são tamanhos de amostra para µ} e ​µ}, respectivamente.**

Para o teste t de Welch, o grau de liberdade é calculado do seguinte modo:

{width="180px"}

O grau de liberdade para ν e ν0 é definido como:

{width="100px"}

{width="100px"}

Em seguida, o valor p pode ser calculado a partir da área na parte traseira da distribuição t:

{width="20%"}

Finalmente, a confiança relatada em Target é definida como:

{width="20%"}

Execução de cálculos offline

O download do relatório de CSV inclui apenas dados brutos e não inclui métricas calculadas, como receita por visitante, aumento ou confiança usada para testes A/B.

Para calcular essas quantidades estatísticas, baixe o arquivo do Excel Target Calculadora de Confiança Completa para inserir o valor da atividade.

recommendation-more-help
3d9ad939-5908-4b30-aac1-a4ad253cd654