选定Audience Manager报表中的数据取样率和错误率 data-sampling-and-error-rates-in-selected-audience-manager-reports
用于某些报表的取样方法摘要、取样错误率以及返回基于取样数据的信息的报表列表。
数据采样比率 data-sampling-ratio
某些Audience Manager报告根据可用数据总量的采样集显示结果。 采样数据比率为1:54。 对于使用采样数据的报表,这意味着您的结果基于每组54条记录中的1条记录。
这些报告使用统计采样数据,因为它们需要大量计算能力才能生成结果。 取样有助于在减少的计算需求、保持系统性能以及提供准确的结果之间取得平衡。
错误率 error-rates
生成重叠数据的报表中可能会发生错误。 错误被定义为满足以下条件的记录的百分比:
- 报表中不应包含该变量,但无论如何仍将其添加。
- 应该列入报告,但被排除在外。
请注意,我们的测试和模型显示错误率 降低 与数据集中的记录数成反比。 与记录数较少的集相比,记录数较多的数据集生成的错误较少。 让我们以更具体的方式来看一下这一断言。 如下表所示,对于一组记录而言,95%的报告结果将低于特定错误率。
记录数
错误率
500 - 1,000
95%的错误率低于42%。
1,000 - 1,500
95%的错误率低于34%。
10,000 - 50,000
95%的错误率低于14%。
50,000
95%的错误率低于6%。
100,000
95%的错误率低于4%。
500,000(或更多)
95%的错误率低于2%。
使用Minhash采样方法 minhash
基于Minhash采样方法,Audience Manager在One Permentation Hashing数据草图的基础上使用一种新的方法计算特征和区段估计值。 与标准估计方法相比,该方法对Jaccard相似性的估计方差更小。 请参阅以下部分,了解使用这种方法的报告。
使用采样数据的报表 reports-using-sampled-data
使用统计采样数据和Minhash采样方法的Audience Manager报表包括:
统计取样
Minhash采样方法
Data Explorer在Search选项卡和任何Saved Searches中使用采样数据
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695