Waarom zou je een lift zien voor één ervaring als de ervaringen identiek zijn?

Er zijn vele redenen waarom u in één ervaring over een andere (identieke) ervaring zou kunnen zien optillen:

De A/A-test werd voortdurend gecontroleerd

Een veelvoorkomend probleem bij het uitvoeren van een test, inclusief een A/A-test, is dat de resultaten voortdurend worden bekeken en dat een test voortijdig wordt stopgezet wanneer u statistische significantie ziet, en dat een winnende ervaring wordt gedeclareerd. De analisten doen vaak wat "gegevens het zoeken"wordt genoemd. Bij het zoeken naar gegevens worden de testgegevens in een vroeg stadium en vaak bekeken, terwijl wordt geprobeerd te bepalen welke ervaring beter presteert. Het risico bestaat dat de test voortijdig wordt stopgezet, waardoor de resultaten ongeldig zouden kunnen worden.

Bij een A/A-test kan gegevensspieken er vaak toe leiden dat analisten in één ervaring een lift zien, terwijl er in feite geen verschil moet zijn, omdat de twee ervaringen identiek zijn. In feite zijn A/A-tests bij continu zoeken gegarandeerd om op een gegeven moment tijdens de test "statistische significantie" aan te tonen (d.w.z. een betrouwbaarheid boven een bepaalde drempel, zoals 95%).

Om dit te vermijden, en zoals met een regelmatige A/B test, zou u daarom van tevoren moeten beslissen welke steekproefgrootte te gebruiken, die op de minimumeffect grootte (de minimumlift onder waarvan een effect niet belangrijk voor uw zaken is), macht, en significantieniveaus wordt gebaseerd u aanvaardbaar vindt.

In een A/A test zou het doel dan zijn niet zie een statistisch significant resultaat nadat uw test de gewenste steekproefgrootte heeft bereikt.

De Adobe Target Sample Size Calculator is een belangrijk hulpmiddel om u te helpen bepalen welke steekproefgrootte u zou moeten richten en hoe lang u de test zou moeten in werking stellen.

Zie ook de volgende artikelen voor informatie over hoe lang u een activiteit moet uitvoeren en andere nuttige tips en trucs: