用於某些報表的取樣方法摘要、取樣錯誤率,以及根據取樣資料傳回資訊的報表清單。
某些 Audience Manager 报表会根据可用数据总量的样本集来显示结果。 采样的数据比率为1:54。 对于使用抽样数据的报表,这意味着您的结果基于每组54记录中的1个记录。
这些报表使用的是统计样本数据,因为它们需要大量的计算能力才能生成结果。 采样有助于在减少计算请求、维护系统性能和提供准确结果之间达到平衡。
错误可能发生在生成重叠数据的报表中。 錯誤定義為記錄中符合以下條件的百分比:
請注意,我們的測試和模型會顯示錯誤率,這點很重要 減少 與資料集中的記錄數成反比。 含有大量記錄的資料集所產生的錯誤會比含有少量記錄的資料集少。 讓我們以更定量的方式審視此判斷提示。 如下表所示,对于一组记录数而言,95% 的报表结果将低于特定的错误率。
记录数 | 错误率 |
---|---|
500 - 1,000 | 95% 的错误率低于42%。 |
1,000 - 1,500 | 95% 的错误率低于34%。 |
10,000 - 50,000 | 95%的錯誤率低於14%。 |
50,000 | 95%的錯誤率低於6%。 |
100,000 | 95% 的错误率低于4%。 |
500000(或更多) | 95% 的错误率低于2%。 |
根据 Minhash 取样方法,Audience Manager 使用 novel 方法计算特征,并在一个排列哈希数据草图上区段 estimators。此新方法产生的变量低于 Jaccard 相似性的标准估算器。 请参阅下面的部分以了解使用此方法的报表。
此 Audience Manager 使用統計抽樣資料和Minhash抽樣方法的報表包括:
統計抽樣 | Minhash取樣方法 |
---|---|
可寻址受众 数据(客户和区段级别的数据)。 | 重叠报表 (特征与特征、区段到特征和区段到区段) |
量度 Profile Merge Rule 的设备 总数。 | 特征推荐 |
数据浏览器 使用选项卡中的 Search 样本数据和任何 Saved Searches | Audience Marketplace Recommendations |