所選 Audience Manager 報表中的資料取樣和錯誤率

用於某些報表的取樣方法的摘要、取樣錯誤率,以及根據取樣資料傳回資訊的報表清單。

資料採樣率

有些Audience Manager報表會根據可用資料總量的取樣集來顯示結果。 採樣資料比為1:54。 對於使用取樣資料的報表,這表示您的結果是以每54筆記錄中的1筆記錄為基礎。

這些報表使用統計取樣資料,因為它們需要大量的運算能力才能產生結果。 抽樣有助於在減少的計算需求、維護系統效能和提供準確結果之間取得平衡。

錯誤率

產生重疊資料的報表中可能會發生錯誤。 錯誤的定義是:

  • 不應包含在報表中,但已新增。
  • 本該包含在報表中,但未列入。

請務必注意,我們的測試和模型顯示錯誤率​以與資料集中記錄數相反的比例減少。 具有大量記錄的資料集產生的錯誤比具有少量記錄的資料集少。 讓我們用更定量的方式來看看這個論斷。 如下表所示,若有一組記錄,95%的報表結果將低於特定錯誤率。

記錄數 錯誤率
500 - 1,000 95%的錯誤率低於42%。
1,000 - 1,500 95%的錯誤率低於34%。
1~5萬 95%的錯誤率低於14%。
50,000 95%的錯誤率低於6%。
十萬 95%的錯誤率低於4%。
500,000(或更多) 95%的錯誤率低於2%。

使用Minhash取樣方法

基於Minhash採樣方法,Audience Manager在單置換哈希資料草圖上使用新的方法來計算特徵和段估計。 這種新方法產生的方差比標準估計的Jaccard相似性要小。 請參閱下節,了解使用此方法的報表。

使用取樣資料的報表

Audience Manager使用統計取樣資料和Minhash取樣方法的報表包括:

統計抽樣 Minhash抽樣方法
可定 址對象資料(客戶和區段層級資料)。 重疊報表 (特徵對特徵、區段對特徵和區段對區段)
Profile Merge Rule的總裝置量度。 特徵建議
資料探 索器會刪除索引標籤中的 Search 取樣資料,以及 Saved Searches Audience MarketplaceRecommendations

本頁內容