Alza

El alza entre una variante ** y la variante de control 0 es el "delta" relativo en las tasas de conversión, definido como el cálculo siguiente, donde las tasas de conversión individuales son como se definen arriba. Esto se muestra como un porcentaje.

Intervalos de confianza válidos en cualquier momento para tratamientos individuales

El panel Experimentación con Recorridos muestra intervalos de confianza "válidos en cualquier momento" (secuencias de confianza) para tratamientos individuales en un experimento.

La secuencia de confianza para una variante individual ν es fundamental para la metodología estadística utilizada por el Adobe. Puede encontrar su definición en esta página (reproducida de [Waudby-Smith y otros]).

Si le interesa estimar un parámetro de destino ψ, como la tasa de conversión de una variante en un experimento, la dicotomía entre una secuencia de intervalos de confianza (CI) de tiempo fijo y una secuencia de confianza uniforme en el tiempo (CS) se puede resumir de la siguiente manera:

Para un intervalo de confianza normal, la garantía probabilística de que el parámetro de destino se encuentra dentro del intervalo de valores de n es válido solamente en un único valor fijo de n (donde n es el número de muestras). Por el contrario, para una secuencia de confianza, se garantiza que en todo momento/ todos los valores del tamaño de muestra t, el valor "true" del parámetro de interés se encuentre dentro de los límites.

Esto tiene algunas implicaciones profundas que son muy importantes para las pruebas en línea:

  • El CSS se puede actualizar de forma opcional cada vez que haya nuevos datos disponibles.
  • Los experimentos pueden monitorizarse continuamente, detenerse de forma adaptativa o continuar.
  • El error de tipo I se controla en todos los momentos de detención, incluidos los tiempos que dependen de los datos.

El Adobe utiliza secuencias de confianza asintóticas, que para una variante individual con estimación media μ tienen la forma:

Donde:

  • N es el número de unidades de esa variante.
  • σ es una estimación de muestra de la desviación estándar (definida anteriormente).
  • α es el nivel deseado de error de tipo I (o probabilidad de cobertura incorrecta). Siempre se establece en 0,05.
  • La constante 2 es una constante que ajusta el tamaño de muestra con el que el CS es más ajustado. El Adobe ha elegido un valor universal de los valores de los valores de los valores de los valores de los valores de los valores de los valores de los valores de los valores de los valores de los valores de los valores de los valores de los valores de los valores de los valores de los valores de los valores de los valores de los experimentos en línea es de los siguientes:

Confianza

La confianza utilizada por el Adobe es una confianza "válida en cualquier momento", que se obtiene invirtiendo la secuencia de confianza para el efecto medio del tratamiento.

Para ser precisos, en una prueba de dos muestras t para la diferencia de medias entre dos variantes, hay una asignación 1:1 entre el valor p de esta prueba y el intervalo de confianza para la diferencia de medias. Por analogía, se puede obtener un valor p válido en cualquier momento invirtiendo la secuencia de confianza (válida en cualquier momento) para el estimador de efecto de tratamiento promedio:

En este caso, E es una expectativa. El estimador utilizado es un estimador de tendencia inversa ponderada (PPI). Consideremos N = N0 +N1 unidades, las asignaciones de variante para cada unidad i etiquetada por Ai=0,1 si la unidad está asignada a la variante ν=0,1. Si a los usuarios se les asigna una probabilidad fija (propensión)0, (1-0) y su métrica de resultado es Yi, el estimador de IPW para el efecto de tratamiento promedio es:

Observando que f es la función de influencia, Waudby-Smith y otros. mostró que la Secuencia de confianza para este estimador es:

Sustituyendo la probabilidad de asignación por sus estimaciones empíricas:0 = N0/N, el término de varianza puede expresarse en términos de estimaciones medias individuales de la muestra:0,1 y estimaciones de la desviación estándar,0,1 como:

A continuación, recuerde que para una prueba de hipótesis regular con la estadística de prueba z = (A-0/p) hay una correspondencia entre los valores de p y los intervalos de confianza:

donde Φ es la distribución acumulativa de la normalidad estándar. Para cualquier momento válido p-valores, dada la secuencia de confianza para el efecto de tratamiento promedio definido anteriormente, podemos invertir esta relación:

Finalmente, la confianza válida en cualquier momento anytime es:

Declarar un experimento como concluyente

Para un experimento con dos ramas, el panel Experimentación con Journey Optimizer muestra un mensaje que indica que un experimento es concluyente cuando la confianza válida en cualquier momento supera el 95 % (es decir, el valor válido en cualquier momento p está por debajo del 5 %).

Cuando hay más de dos variantes, se aplica la corrección de Bonferroni para controlar la tasa de error en el sentido familiar. Para un experimento con K tratamientos y un único tratamiento de línea de base (control), hay K-1 pruebas de hipótesis independientes. La corrección de Bonferroni significa que rechazamos la hipótesis nula de que el control y una variante determinada tienen medios iguales, si el valor de p válido en cualquier momento (definido anteriormente) está por debajo de un umbral de α/(K-1).

Brazo con mejor rendimiento

Cuando se declara que un experimento es concluyente, se muestra el brazo con mejor rendimiento. Este es el brazo con el mejor rendimiento (media o tasa de conversión más alta), entre el conjunto que incluye el control y todos los brazos que tienen un valor de p por debajo del umbral de Bonferroni.

Página anteriorComprensión de los cálculos estadísticos
Página siguienteTrabajar con Experience Manager Assets

Journey Optimizer