Metodología Estadística Del Adobe: Secuencias De Confianza Válidas En Cualquier Momento

Una secuencia de confianza es un análogo secuencial de un intervalo de confianza, por ejemplo, si repite los experimentos cien veces y calcula una estimación de la métrica media y su secuencia de confianza del 95 % asociada para cada nuevo usuario que entra en el experimento. Una secuencia de confianza del 95 % incluirá el valor verdadero de la métrica en 95 de los 100 experimentos que ejecutó. Un intervalo de confianza del 95 % solo se podía calcular una vez por experimento para ofrecer la misma garantía de cobertura del 95 %; no con cada nuevo usuario. Por lo tanto, las secuencias de confianza le permiten monitorizar continuamente los experimentos, sin aumentar las tasas de error de los falsos positivos.

La diferencia entre las secuencias de confianza y los intervalos de confianza para un único experimento se muestra en la siguiente animación:

Secuencias de confianza desplazan el enfoque de Experimentos a la estimación en lugar de a las pruebas de hipótesis; es decir, se centran en la estimación precisa de la diferencia en las medias entre tratamientos, en lugar de rechazar o no una hipótesis nula basada en un umbral de relevancia estadística.

Sin embargo, de manera similar a la relación entre p-values, o Confianza e Intervalos de confianza, también existe una relación entre Secuencias de confianza y cualquier momento válido p-values, o cualquier momento válido Confianza. Dada la familiaridad de cantidades como Confianza, Adobe proporciona tanto las Secuencias de Confianza como la confianza válida en cualquier momento en sus informes.

Los fundamentos teóricos de Secuencias de Confianza provienen del estudio de secuencias de variables aleatorias conocidas como martingales. A continuación se incluyen algunos resultados principales para lectores expertos, pero las conclusiones de los profesionales son claras:

NOTE
Las secuencias de confianza se pueden interpretar como análogos secuenciales seguros de los intervalos de confianza. Con intervalos de confianza solo puede interpretar el experimento una vez que haya alcanzado el tamaño de muestra predeterminado. Sin embargo, con las secuencias de confianza puede ver e interpretar los datos de los experimentos siempre que lo desee y detener o continuar los experimentos de forma segura. La confianza válida en cualquier momento correspondiente, o p-value, también se puede interpretar con seguridad en cualquier momento.

Es importante señalar que, dado que las secuencias de confianza son "válidas en cualquier momento", serán más conservadoras que una metodología de horizonte fijo utilizada con el mismo tamaño de muestra. Los límites de la secuencia de confianza son generalmente más anchos que el cálculo del intervalo de confianza, mientras que la confianza válida en cualquier momento será menor que el cálculo de confianza del horizonte fijo. El beneficio de este conservadurismo es que puedes interpretar tus resultados de forma segura en todo momento.

Declarar un experimento como concluyente

Cada vez que visualiza el informe de experimentación, Adobe analiza los datos que se hayan acumulado en el experimento hasta este momento. Luego declara que un experimento es "concluyente" cuando la confianza válida en cualquier momento supere el umbral del 95 % para al menos uno de los tratamientos.

En este punto, el tratamiento que funcione mejor (según la tasa de conversión o el valor de métrica normalizado por perfiles) se resaltará en la parte superior de la pantalla del informe y se indicará con una estrella en el informe tabular. En esta determinación solo se tienen en cuenta los tratamientos que tienen una confianza superior al 95 %, junto con la línea de base.

Cuando hay más de dos tratamientos, se utiliza el enlace de corrección de Bonferroni para corregir los problemas de comparación múltiple y controla la tasa de error familiar. En este escenario, también es posible que haya varios tratamientos cuya confianza sea superior al 95 % y cuyos intervalos de confianza se superpongan. En este caso, Adobe Journey Optimizer declarará que el que tenga la tasa de conversión más alta (o el valor de métrica normalizado por perfiles) es el que tiene el mejor rendimiento.

Página anteriorCreación de un experimento de contenido
Página siguienteExplicación de los cálculos estadísticos en el informe de experimentación

Journey Optimizer