Journey Optimizer Experimentation Accelerator最佳作法 content-experiment-best-practices

什麼是A/B測試?

A/B測試是比較兩個或更多版本的東西以判斷哪些在定義的目標上表現較好的程式。

參與者會被隨機指派到一個版本(稱為變體),並會追蹤其行為。 結果會顯示某個版本在統計上是否優於其他版本。

重要術語

術語
定義
控制
用作比較基準的原始版本。
變體或處理
建立新版本以針對控制項進行測試。
假設
預測哪些變更將產生更好的結果,以及原因。
樣本大小
測試中包含的個人或工作階段數。
統計顯著性
測量結果非隨機機率所導致的信賴測量。
提升度
變體與控制項相比的改善或減少百分比。
主要量度
用來判斷測試是否成功的主要測量。
次要量度
提供額外insight或協助監控意外影響的支援量度。
信賴區間
真實效果可能下降的估計範圍。
區段
獨立分析的特定對象子集(例如,新使用者、行動訪客)。

執行實驗的最佳作法

  • 以明確的假設開始

    一個強有力的假設包括您正在改變什麼、您預期會發生什麼以及發生原因。
    範例: 我們相信變更X會因為Z而增加Y。

  • 定義有意義的成功量度

    選擇符合您更廣泛目標的量度。 避免看起來好但無法反映實際影響的「虛名」量度。

  • 一次測試一個變更(可能的話)

    隔離變數可讓您更輕鬆地準確解讀結果。 如果一次測試多項變更,您可能無法知道造成影響的原因。

  • 讓測試執行足夠長的時間

    過早的結論可能會產生誤導。 等候統計上顯著的樣本大小後再採取行動。

  • 注意外部因素

    季節性、假期和環境中的其他變更可能會影響結果。 記錄任何可能影響測試期間行為的內容。

  • 周詳使用分段

    依受眾區段劃分結果可揭示隱藏的模式,但避免過度解讀小型樣本。

  • 檔案並共用學習專案

    清楚記錄測試內容、測試原因以及所學知識。 這有助於建立機構知識,避免重複錯誤。

通用量度

量度
測量內容
使用時機
轉換率
完成所需動作的使用者百分比
對於追蹤目標導向體驗的成功非常有用
點進率(CTR)
按一下特定元素的使用者百分比
表示體驗的吸引人程度
參與率
使用者與體驗的互動等級
適合測量興趣或關注
跳出率
不採取動作而快速離開的使用者百分比
可能表示不適或混淆體驗
頁面逗留時間
使用者在體驗特定部分所花費的時間
可反映興趣深度或複雜性
每位訪客帶來的收入(RPV)
每個使用者取得的平均收入
常用於以商業為中心的實驗
保留率
一段時間內回訪或持續參與的使用者百分比
適合用於長期價值評估

什麼是好的實驗?

一個好的實驗不只產生一個勝利,它產生一個清晰、可操作的學習。
以下是要尋找的內容:

&檢查; 統計信賴度:變體之間的差異不太可能是偶然造成的。
&檢查; 與目標校準:主要量度反映向業務目標邁進的有意義進度。
&檢查; 次要影響:對相關量度沒有顯著的負面影響。
&檢查; 可擴充性:此結果可為未來的決策提供資訊,或將其泛化至其他區域。
✓ 清晰度:結果的原因已被合理隔離和理解。

實驗不僅僅是尋找「最佳」版本,它也是透過測試和反複專案來建立知識。 在成功完成時,實驗會顯示推動更明智決策、更佳使用者體驗和改進結果的見解。

recommendation-more-help

範例:

  • 公司:連鎖飯店

  • 假設:如果在首頁上使用更緊急的語言,將會導致更多預訂。

    • 控制項:原始版本
    • 變體:已新增具有急迫性的新版本
    • 主要量度:預訂率
    • 次要量度:跳出率、網站逗留時間
  • 結果:變體使預訂率提升14%,其他量度沒有負數變更。

  • 動作:請考慮推出變體並執行後續實驗,以在其他區域測試類似的方法。

7b38046a-d60e-45d5-a97c-2e4108e3b5dd