¿Por qué podría ver el alza de una experiencia cuando las experiencias son idénticas?
Existen numerosas razones por las que podría ver el alza de una experiencia sobre otra experiencia (idéntica):
La prueba A/A se monitorizó continuamente
Un problema común al ejecutar cualquier tipo de prueba, incluida una prueba A/A, es observar los resultados continuamente y detener prematuramente una prueba cuando vea significación estadística y declarar una experiencia ganadora. Los analistas suelen hacer lo que se denomina "búsqueda de datos". La observación de datos implica ver los datos de prueba de forma temprana y frecuente, a la vez que se intenta determinar qué experiencia está teniendo un mejor rendimiento. El riesgo es detener la prueba prematuramente, lo que podría invalidar los resultados.
En una prueba A/A, la observación de datos a menudo puede hacer que los analistas vean el alza en una experiencia, cuando en realidad no debería haber ninguna diferencia, ya que las dos experiencias son idénticas. De hecho, con el peeking continuo, las pruebas A/A están garantizadas para mostrar "relevancia estadística" (es decir, una confianza por encima de un determinado umbral, como el 95 %) en algún momento durante la prueba.
Para evitarlo, y al igual que con una prueba A/B normal, debe decidir con antelación qué tamaño de muestra utilizar, en función del tamaño mínimo del efecto (el alza mínima por debajo de la cual un efecto no es importante para su negocio), la potencia y los niveles de relevancia que considere aceptables.
En una prueba A/A, el objetivo sería no ver un resultado estadísticamente significativo después de que la prueba haya alcanzado el tamaño de muestra deseado.
Adobe Target Sample Size Calculator es una herramienta importante que le ayudará a determinar el tamaño de muestra que debe tener como objetivo y durante cuánto tiempo debe ejecutar la prueba.
Además, consulte los siguientes artículos para obtener información sobre cuánto tiempo debe durar una actividad y otros consejos y trucos útiles: