解讀自動分配報告

透過檢查重要指標(包括提升度和可信度),解譯自動分配Adobe Target中A/B活動的結果。

許多行銷人員犯了一種錯誤,在結果指出明確的贏家之前便提早宣告獲勝體驗。我們現在已經可讓您輕鬆決定獲勝者。

注意

如需宣告獲勝者的一般資訊,請參閱十個常見A/B測試陷阱以及避免方式

識別成功體驗

使用自動分配功能時,在活動達到最低轉換次數且有足夠信賴度之前,Target 會在活動頁面頂端顯示徽章,指出「尚未有贏家」。

無贏家徽章

宣告明確的獲勝者時,Target 會顯示「獲勝者: 體驗 X」。

注意

「自動分配」活動旨在所有選項之中找出最佳體驗,而不只與控制項進行成對比較而已。

自動分配的統計保證

A/B 活動結束時,「自動分配」會保證決定的獲勝者有 5% 的有效誤判率。這表示在活動的所有體驗之中,只有 5% 的時間,決定的獲勝者實際上不是最佳體驗。如果是 A/A 測試 (使用相同的體驗),我們發現測試有小於 5% 的時間。A/A 測試 (使用相同的體驗) 的預期行為是無限期執行,所以獲勝者徽章永遠不會出現。

對於「自動分配」,我們不採用 p 值信賴度。

「自動分配」的「信賴度」欄 (如下圖) 顯示體驗是獲勝者的機率,誤差率在 1% 之內 (亦即,在最佳和次佳轉換率之間,演算法採用最低可偵測效應 1%)。請注意,演算法採用 Bernstein 不等式來計算此機率。

一般 A/B 測試會根據 p 值來計算信賴度。「自動分配」不使用 p 值。P 值會「寬鬆」計算所給定體驗與控制項不同的機率。這些 p 值只能用來判斷體驗是否可能與控制不同。這些值只能用來判斷體驗是否與另一個體驗 (非控制) 不同。

重要

Target會在預先定義的最低轉換次數之後顯示獲勝者;不過,挑選獲勝者的最終決定應一律取決於Adobe Target 樣本大小電腦的結果。 Target不會考慮網站的基本轉換率,以及提供給計算器以決定活動持續時間的其他重要方面。 因此,Target可能會根據最低轉換次數,顯示比保證更早的獲勝者。 如需詳細資訊,請參閱樣本大小電腦

了解自動分配活動中的提升度和可信度報表

在自動分配活動中,第一個體驗(依預設命名為體驗A)一律會在「報表」標籤上定義為「控制」體驗。 在用來判斷體驗效能的模型中,此體驗不會視為真正的統計控制,但會視為報表中某些數字的參考或基線。

每個體驗的「提升度」數值和95%界限一律會參照已定義的「控制」體驗來計算。 定義的「控制」體驗無法具有相對本身的提升度,因此會針對此體驗報告空白的「 — 」值。 與A/B測試不同,在自動分配測試中,如果體驗的執行效果不如定義的控制,則不會回報負提升度值;而會顯示「 — 」。

顯示的「信賴區間」列代表體驗轉換率的平均估計周圍95%信賴區間。 這些也會與定義的「控制」體驗有色編碼。 「控制」體驗的列一律顯示為灰色。 「控制」體驗之下的信賴區間部分會顯示為紅色,而「控制」體驗上方的信賴區間部分會顯示為綠色。

前導體驗的95%信賴區間與任何其他體驗不重疊時,即會找到獲勝者。 成功體驗會在體驗名稱左側和「成功者」橫幅中指定為綠色星號徽章。 當沒有星號可見時,橫幅會讀取「尚未有贏家」,且尚未找到贏家。

目前領先或勝出體驗旁也會報告「信賴度」數字。 只有在主要體驗的「信賴度」達到至少60%時,才會報告此數字。 如果自動分配實驗中只有兩個體驗,此數字代表體驗比其他體驗表現較佳的信賴等級。 如果自動分配實驗中有超過兩個體驗,此數字代表體驗的執行成效比定義的「控制」體驗好的信賴等級。 如果「控制」體驗成功,則不會回報「可信度」數字。

常見問題

進入活動已過了幾天。為何所有信賴度仍顯示 0%?

下列任何原因說明所有活動在報表的「信賴度」欄中為何顯示 0%:

  • 手動 A/B 測試和「自動分配」使用不同的統計量來顯示「信賴度」值。

    手動 A/B 測試採用基於 Student 的 t 檢定的 p 值。由於實際上並沒有這種差異,P 值是尋找在體驗與控制之間觀察到 (或更極端) 之差異的機率。這些 P 值只能用來判斷觀察到的資料是否與指定體驗一致,並且有相同的控制。這些值只能用來判斷體驗是否與另一個體驗 (非控制) 不同。

    自動分配顯示在活動的所有體驗之中,所給定體驗是真正獲勝者的機率。這表示只有勝出體驗 (很可能就是獲勝者) 才有非零的信賴值。其他很可能全部都是失敗者,將會顯示 0%。

  • 只有在勝出體驗收集到 60% 信賴度時,「自動分配」才會開始顯示信賴度。這些信賴等級通常會在一般A/B測試完成所需的約一半時間內出現(雖然這並非保證)。 要確定正常A/B測試將運行多久,請使用樣本大小計算器:將控制項的轉換率插入「基準轉換率」、「提升度」為「5%」、「信賴度」為95%。 通常在每一個體驗至少累積每一體驗必要樣本的 50% 之後,才會開始出現信賴度。這樣可讓您大概知道何時會開始出現信賴度。

  • 如果報表完全顯示 0%,可能表示太早進入活動。

本頁內容