选定 Audience Manager 报表中的数据取样率和错误率

一些报表使用的抽样方法、抽样错误率以及根据抽样数据返回信息的报表列表的摘要。

数据采样率

某些Audience Manager报表会根据可用数据总量的抽样集显示结果。 采样数据比为1:54。 对于使用采样数据的报表,这意味着您的结果基于每54条记录集中的1条记录。

这些报表使用统计的采样数据,因为它们需要大量计算能力才能生成结果。 采样有助于在减少的计算需求、保持系统性能和提供准确结果之间取得平衡。

错误率

在生成重叠数据的报表中可能会出错。 错误被定义为以下记录的百分比:

  • 不应包含在报表中,但仍应添加。
  • 本应包含在报告中,但被排除在外。

请务必注意,我们的测试和模型显示错误率​以与数据集中记录数成反比的比例减少。 具有大量记录的数据集产生的错误少于具有少量记录的数据集。 让我们从更定量的角度来审视这一论断。 如下表所示,对于一组记录,95%的报表结果将低于特定错误率。

记录数 错误率
500 - 1,000 95%的错误率低于42%。
1,000 - 1,500 95%的错误率低于34%。
1~5万 95%的错误率低于14%。
50,000 95%的错误率低于6%。
十万 95%的错误率低于4%。
500,000(或更多) 95%的错误率低于2%。

使用Minhash采样方法

基于Minhash采样方法,Audience Manager使用一种新方法在一个置换哈希数据草图上计算特征和区段估计。 该方法比标准估计器对Jaccard相似度产生的方差要小。 有关使用此方法的报表,请参阅以下部分。

使用采样数据的报表

Audience Manager使用统计采样数据和Minhash采样方法的报告包括:

统计抽样 Minhash采样方法
可寻 址受众数据(客户级别和区段级别数据)。 重叠报表 (特征到特征、区段到特征和区段到区段)
Profile Merge Rule的设备总数量度。 特征推荐
数据 浏览器在选项卡和任 Search 何 Saved Searches Audience MarketplaceRecommendations

在此页面上