选定Audience Manager报表中的数据取样率和错误率
最近更新: 2024年7月22日
用于某些报表的取样方法摘要、取样错误率以及返回基于取样数据的信息的报表列表。
数据采样比率
某些Audience Manager报告根据可用数据总量的采样集显示结果。 采样数据比率为1:54。 对于使用采样数据的报表,这意味着您的结果基于每组54条记录中的1条记录。
这些报告使用统计采样数据,因为它们需要大量计算能力才能生成结果。 取样有助于在减少的计算需求、保持系统性能以及提供准确的结果之间取得平衡。
错误率
生成重叠数据的报表中可能会发生错误。 错误被定义为满足以下条件的记录的百分比:
- 报表中不应包含该变量,但无论如何仍将其添加。
- 应该列入报告,但被排除在外。
请注意,我们的测试和模型显示错误率 降低 与数据集中的记录数成反比。 与记录数较少的集相比,记录数较多的数据集生成的错误较少。 让我们以更具体的方式来看一下这一断言。 如下表所示,对于一组记录而言,95%的报告结果将低于特定错误率。
记录数 | 错误率 |
---|---|
500 - 1,000 | 95%的错误率低于42%。 |
1,000 - 1,500 | 95%的错误率低于34%。 |
10,000 - 50,000 | 95%的错误率低于14%。 |
50,000 | 95%的错误率低于6%。 |
100,000 | 95%的错误率低于4%。 |
500,000(或更多) | 95%的错误率低于2%。 |
使用Minhash采样方法
基于Minhash采样方法,Audience Manager在One Permentation Hashing数据草图的基础上使用一种新的方法计算特征和区段估计值。 与标准估计方法相比,该方法对Jaccard相似性的估计方差更小。 请参阅以下部分,了解使用这种方法的报告。
使用采样数据的报表
使用统计采样数据和Minhash采样方法的Audience Manager报表包括:
统计取样 | Minhash采样方法 |
---|---|
可寻址受众数据(客户和区段级别的数据)。 | 重叠报表(特征到特征、区段到特征和区段到区段) |
Profile Merge Rule的总设备指标。 | 特征推荐 |
Data Explorer在Search选项卡和任何Saved Searches中使用采样数据 | Audience MarketplaceRecommendations |
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695