文档 Journey Optimizer Journey Optimizer 指南

了解试验报告中的统计计算 experiment-report-calculations

Last update: Fri Dec 29 2023 00:00:00 GMT+0000 (Coordinated Universal Time)

创建对象：

Experienced
User

本页记录了Adobe Journey Optimizer中促销活动的试验报告中使用的详细统计计算。

请注意，本页面向技术用户。

转化率

转换率或 平均值， μ_ν 进行每种处理 ν 在试验中，定义为量度总和与分配给该量度的配置文件数量的比率，N_ν：

center-align w-125

给，Y_iν 是每个用户档案的目标量度的值 i，已分配给给定变体 ν. 当目标量度是“唯一”量度（即，它是执行特定操作的配置文件数量的计数）时，将显示为转化率，并设置百分比格式。当量度是“计数”或“总值”量度（分别例如，电子邮件打开次数、收入）时，该量度的平均估计值将显示为“每个用户档案计数”或“每个用户档案的值”。

在需要时，使用样本标准差与表达式：

center-align w-225

提升 lift

变量之间的提升 ν、和控制变量 ν₀ 为转换率的相对“增量”，其定义见下文计算，其中个别转换率定义见上文。以百分比显示。

center-align w-125

单个处理的随时有效置信区间

历程试验面板显示试验中各个治疗的“随时有效”置信区间（置信序列）。

单个变体的置信序列 ν 是Adobe所用统计方法的核心。您可以在以下位置找到其定义此页面 (复制自 [沃德比 — 史密斯等])。

如果您有兴趣估计目标参数 ψ 例如，试验中变量的转化率，一系列“固定时间”置信区间(CI)与时间均匀置信序列(CS)之间的二分法可概括如下：

center-align w-500

对于正则置信区间，概率保证目标参数位于值ċ范围内_n 仅在的单个固定值下有效 n (其中 n 是样本数)。相反，对于置信序列，我们保证在任何时候/所有样本大小值 t，则目标参数的“true”值在边界内。

这隐含着一些对在线测试非常重要的深层含义：

当有新数据可用时，可以选择更新CS。
可以连续监控、自适应停止或继续试验。
I类错误会在所有停止时间（包括依赖于数据的时间）进行控制。

Adobe使用渐近置信序列，它适用于具有平均估计值的单个变量 μ 其形式为：

center-align w-300

其中：

N 是该变体的单位数。
σ 是标准偏差的样本估计值（定义见上文）。
α 是I型错误（或误覆盖概率）的所需级别。此值始终设置为0.05。
ρ ² 是一个常数，用于调整CS最紧的样本大小。 Adobe已选择一个ρ的通用值 ² = 10 ^-2.8 ，这适用于在线实验中显示的转化率类型。

置信度 confidence

Adobe所用的置信度是一种“随时有效”的置信度，它是通过对平均处理效果的置信序列进行逆变换获得的。

更准确地说，在两个样本中 t 测试两个变体之间的均数差异，变体之间采用1:1映射 p-value，以及均值的差值的置信区间。打个比方，随时有效 p-value可以通过反转平均治疗效果估计器的（随时有效）置信序列来获得：

center-align w-200

此处， E 是一种期望。使用的估计器是反向倾向加权(IPW)估计器。考虑N = N₀ +N₁ 单位，每个单位的变量分配 i 标记为A_i=0,1（如果单位已分配给变体） ν=0,1. 如果用户被分配了固定概率（倾向） π₀， (1-π₀)，其结果量度为Y_i，则IPW的平均处理效果估计器为：

center-align w-400

注意到 f 是影响函数，沃德比 — 史密斯等表明该估算器的置信序列为：

center-align w-500

用经验估计代替赋值概率： π₀ = N₀/N，方差项可以用个别样本的平均估计值μ来表示_0,1 和标准差估计值，σ_0,1 作为：

center-align w-500

接下来，回忆一下，对于带有测试统计量z = (μ)的常规假设检验_A-μ₀/σ_p)两者之间有通信 p — 值和置信区间：

center-align w-500

位置 Φ 是标准常数的累积分布。无论何时有效 p — 值，给定上面定义的平均处理效果的置信序列，我们可以反转此关系：

center-align w-600

最后， 随时有效的置信度 为：

center-align w-200

宣布试验具有结论性

对于双臂试验，Journey Optimizer试验面板会显示一条消息，说明某个试验是 已有定论 当随时有效置信度超过95%(即，随时有效 p-value小于5%)。

当存在两个以上的变量时，应用Bonferonni校正来控制族的错误率。对于试验 K 治疗方法和单一基准（对照）治疗方法有 K-1 独立假设检验。 Bonferonni校正意味着我们拒绝了空的假设，即如果任意时刻有效，控制变量和给定变量具有相等的均值 p-value（以上定义）低于阈值 α/(K-1).

性能最佳的手臂

当一个实验被宣布为具有结论性时，显示表现最好的臂。这是包含控制项的Set中具有最佳性能（最高平均或转换率）的臂以及所有具有 p — 值低于Bonferonni阈值。

recommendation-more-help

b22c9c5d-9208-48f4-b874-1cefb8df4d76