一些报表使用的抽样方法、抽样错误率以及根据抽样数据返回信息的报表列表的摘要。
某些Audience Manager报表会根据可用数据总量的抽样集显示结果。 采样数据比为1:54。 对于使用采样数据的报表,这意味着您的结果基于每54条记录集中的1条记录。
这些报表使用统计的采样数据,因为它们需要大量计算能力才能生成结果。 采样有助于在减少的计算需求、保持系统性能和提供准确结果之间取得平衡。
在生成重叠数据的报表中可能会出错。 错误被定义为以下记录的百分比:
请务必注意,我们的测试和模型显示错误率以与数据集中记录数成反比的比例减少。 具有大量记录的数据集产生的错误少于具有少量记录的数据集。 让我们从更定量的角度来审视这一论断。 如下表所示,对于一组记录,95%的报表结果将低于特定错误率。
记录数 | 错误率 |
---|---|
500 - 1,000 | 95%的错误率低于42%。 |
1,000 - 1,500 | 95%的错误率低于34%。 |
1~5万 | 95%的错误率低于14%。 |
50,000 | 95%的错误率低于6%。 |
十万 | 95%的错误率低于4%。 |
500,000(或更多) | 95%的错误率低于2%。 |
基于Minhash采样方法,Audience Manager使用一种新方法在一个置换哈希数据草图上计算特征和区段估计。 该方法比标准估计器对Jaccard相似度产生的方差要小。 有关使用此方法的报表,请参阅以下部分。
Audience Manager使用统计采样数据和Minhash采样方法的报告包括:
统计抽样 | Minhash采样方法 |
---|---|
可寻 址受众数据(客户级别和区段级别数据)。 | 重叠报表 (特征到特征、区段到特征和区段到区段) |
Profile Merge Rule的设备总数量度。 | 特征推荐 |
数据 浏览器在选项卡和任 Search 何 Saved Searches | Audience MarketplaceRecommendations |