Cálculos estadísticos en Pruebas A/Bn
Este artículo documenta los cálculos estadísticos detallados utilizados en las pruebas A/Bn manuales en Adobe Target. Se han proporcionado definiciones para Conversion Rate, Confidence Interval of Conversion Rate, Lift, Confidence Interval for Lift y Confidence.
Rendimiento medio
En la siguiente sección se explican los cálculos utilizados en la ilustración anterior.
Campañas de tasa de conversión e ingresos por visitante (RPV)
La siguiente ilustración muestra Conversion Rate, Confidence Interval of Conversion Rate y el número de Conversions en un informe de Target. Por ejemplo, la primera línea muestra que para la Experiencia A: Conversion Rate es 25,81% con un Confidence Interval de ±7,7% y se registraron 32 conversiones. Dado que 124 visitantes vieron la experiencia, esto equivale a 32/124 = 25,81 %.
{width="25%"}
La tasa de conversión de media, , para cada experiencia ** de un experimento se define como una relación entre la suma de la métrica y el número de unidades asignadas a esa métrica, N:
{width="125px"}
Aquí,
-
Yi es el valor de la métrica para cada unidad i, que se ha asignado a una experiencia determinada **.
-
La suma sobre las unidades i depende de la elección de la metodología de conteo.
- Si se usa Visitors como metodología de contabilización, cada unidad es un visitante único definido como un participante único en la actividad durante la vida de la actividad.
- Si se usa Visits como metodología de contabilización, cada unidad es una visita única definida como un participante único en una experiencia durante una sesión de Target (con un(a)
sessionId
único(a). CuandosessionId
cambia o el visitante llega al paso de conversión, se cuenta una nueva visita. - Si se usa Activity Impressions como metodología de contabilización, cada unidad es una impresión única definida como cada vez que un visitante carga una página de la actividad.
Confidence Interval of Mean/Conversion Rate
El intervalo de confianza de la tasa de conversión se define de forma intuitiva como un rango de posibles tasas de conversión que es coherente con los datos subyacentes.
Al ejecutar experimentos, la tasa de conversión de una experiencia determinada es de estimación de la tasa de conversión "verdadera". Para cuantificar la incertidumbre de esta estimación, Target utiliza un intervalo de confianza. Target siempre informa de un intervalo de confianza del 95 %, lo que significa que al final, el 95 % de los intervalos de confianza calculados incluyen la tasa de conversión real de la experiencia.
Un intervalo de confianza del 95 % de la tasa de conversión se define como el intervalo de valores:
{width="30%"}
Donde el error estándar de la media se define como
{width="75px"}
Cuando se utilice una estimación imparcial de la desviación típica de la muestra:
{width="200px"}
Cuando la campaña es una campaña de tasa de conversión (es decir, la métrica de conversión es binaria), el error estándar se reduce a:
{width="150px"}
Alza
La siguiente ilustración muestra Lift y Confidence Interval of Lift en un informe de Target. El número representa la media del rango de los límites del alza, y la flecha refleja si el alza es positiva o negativa. La flecha se muestra en gris hasta que la confianza pasa el 95 %. Una vez que la confianza ha superado el umbral, la flecha aparece en verde o en rojo según un alza positiva o negativa.
{width="35%"}
El alza entre una experiencia ** y la experiencia de control 0 es el "delta" relativo en las tasas de conversión, definido como
{width="15%"}
Donde las tasas de conversión individuales son las definidas anteriormente. Más sencillamente,
Lift(Experience N) = (Performance_Experience_N - Performance_Control)/ Performance_Control
Si la tasa de conversión de la experiencia de control 0 es 0, no hay alza.
Confidence Interval of Lift
El gráfico de gráfico de cuadro de la columna Average Lift and Confidence Interval representa el valor promedio y el 95 % Confidence Interval of Lift. El gráfico del cuadro aparece en gris cuando hay alguna superposición en el intervalo de confianza de una experiencia no de control determinada con el intervalo de confianza de la experiencia de control. El gráfico del cuadro es de color verde o rojo cuando el intervalo de confianza de una experiencia determinada está por encima o por debajo del intervalo de confianza de la experiencia de control.
El error estándar del alza entre una experiencia ** y la experiencia de control 0 se define de la siguiente manera:
{width="35%"}
A continuación, el intervalo de confianza del 95 % del alza es:
{width="40%"}
Este cálculo usa el método "Delta" y se describe con más detalle en este documento
Confidence
La última columna muestra la confianza en un informe Target. La confianza de una experiencia es una probabilidad (denotada como porcentaje) de obtener un resultado tan extremo como el que se observa, dado que la hipótesis nula es cierta. En términos de valores p, la confianza mostrada es 1 - valor p. De forma intuitiva, una mayor confianza significa que es menos probable que la experiencia de control y la que no es de control tengan tasas de conversión iguales.
En Target, se realiza una prueba t de Welch de dos colas entre la experiencia de prueba y la experiencia de control para comprobar si los medios de las experiencias de prueba y control son los mismos. Debido a que generalmente no sabemos si los tamaños de muestra y las variaciones de dos grupos son iguales antes de ejecutar el experimento y Target también le permite tener porcentajes desiguales de tráfico enviado a cada experiencia, no asumimos que la variación de cada experiencia sea igual. Por lo tanto, se elige la prueba T de Welch en lugar de la prueba T de estudiante.
Para realizar la prueba T de Welch, primero se empieza a calcular la estadística t y los grados de libertad y, a continuación, se ejecuta una prueba T de dos colas para generar el valor p. Finalmente, calculamos la confianza en función del valor p.
La estadística t se define como la diferencia de las medias de dos variables aleatorias independientes, ** y 0, divididas por el error estándar de la diferencia:
{width="100px"}
Donde v y v0 son los medios de ** y 0 respectivamente, y el error estándar de la diferencia entre v y v0 lo dan:
{width="150px"}
Donde 2v y 2v0 son las variaciones de dos experiencias y 12}0 respectivamente, y Nv y Nv0 son tamaños de muestra para y }0 respectivamente.
Para la prueba T de Welch, el grado de libertad se calcula de la siguiente manera:
{width="180px"}
Y el grado de libertad de ** y 0 se define de la siguiente manera:
{width="100px"}
{width="100px"}
A continuación, el valor p se puede calcular a partir del área de las colas de la distribución t:
{width="20%"}
Finalmente, la confianza notificada en Target se define como:
{width="20%"}
Realización de cálculos sin conexión
El informe CSV descargado solo contiene datos sin procesar; no incluye métricas calculadas, como los ingresos por visitante, el alza o la confianza, utilizadas en las pruebas A/B.
Para calcular estas cantidades estadísticas, descargue el archivo de Excel Target Calculadora de confianza completa para introducir el valor de la actividad.