选定Audience Manager报表中的数据取样率和错误率 data-sampling-and-error-rates-in-selected-audience-manager-reports

用于某些报表的取样方法摘要、取样错误率以及返回基于取样数据的信息的报表列表。

数据采样比率 data-sampling-ratio

某些Audience Manager报告根据可用数据总量的采样集显示结果。 采样数据比率为1:54。 对于使用采样数据的报表,这意味着您的结果基于每组54条记录中的1条记录。

这些报告使用统计采样数据,因为它们需要大量计算能力才能生成结果。 取样有助于在减少的计算需求、保持系统性能以及提供准确的结果之间取得平衡。

错误率 error-rates

生成重叠数据的报表中可能会发生错误。 错误被定义为满足以下条件的记录的百分比:

  • 报表中不应包含该变量,但无论如何仍将其添加。
  • 应该列入报告,但被排除在外。

请注意,我们的测试和模型显示错误率​ 降低 ​与数据集中的记录数成反比。 与记录数较少的集相比,记录数较多的数据集生成的错误较少。 让我们以更具体的方式来看一下这一断言。 如下表所示,对于一组记录而言,95%的报告结果将低于特定错误率。

记录数
错误率
500 - 1,000
95%的错误率低于42%。
1,000 - 1,500
95%的错误率低于34%。
10,000 - 50,000
95%的错误率低于14%。
50,000
95%的错误率低于6%。
100,000
95%的错误率低于4%。
500,000(或更多)
95%的错误率低于2%。

使用Minhash采样方法 minhash

基于Minhash采样方法,Audience Manager在One Permentation Hashing数据草图的基础上使用一种新的方法计算特征和区段估计值。 与标准估计方法相比,该方法对Jaccard相似性的估计方差更小。 请参阅以下部分,了解使用这种方法的报告。

使用采样数据的报表 reports-using-sampled-data

使用统计采样数据和Minhash采样方法的Audience Manager报表包括:

统计取样
Minhash采样方法
可寻址受众数据(客户和区段级别的数据)。
重叠报表(特征到特征、区段到特征和区段到区段)
Profile Merge Rule的总设备指标。
特征推荐
Data Explorer在Search选项卡和任何Saved Searches中使用采样数据
Audience MarketplaceRecommendations
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695