所選Audience Manager報表中的資料取樣和錯誤率 data-sampling-and-error-rates-in-selected-audience-manager-reports
用於某些報表的取樣方法摘要、取樣錯誤率,以及根據取樣資料傳回資訊的報表清單。
資料取樣比例 data-sampling-ratio
有些Audience Manager報告會根據可用資料總量的取樣集來顯示結果。 取樣資料比率為1:54。 對於使用取樣資料的報表,這表示您的結果以54筆記錄每組1筆記錄為基礎。
這些報表使用統計抽樣資料,因為它們需要大量運算能力才能產生結果。 取樣有助於在減少的運算需求、維持系統效能以及提供精確的結果之間取得平衡。
錯誤率 error-rates
產生重疊資料的報表中可能會發生錯誤。 錯誤定義為記錄中符合以下條件的百分比:
- 本來不應該納入報表,但還是被新增了。
- 應該包含在報表中,但卻被排除在外。
請注意,我們的測試和模型顯示錯誤率 會減少,與資料集中的記錄數成反比。 含有大量記錄的資料集所產生的錯誤會比含有少量記錄的資料集少。 讓我們以更定量的方式檢視此判斷提示。 如下表所示,對於一組記錄,95%的報告結果將低於特定錯誤率。
記錄數
錯誤率
500 - 1,000
95%的錯誤率低於42%。
1,000 - 1,500
95%的錯誤率低於34%。
10,000 - 50,000
95%的錯誤率低於14%。
50,000
95%的錯誤率低於6%。
100,000
95%的錯誤率低於4%。
500,000 (或更多)
95%的錯誤率低於2%。
使用Minhash取樣方法 minhash
根據Minhash取樣方法,Audience Manager使用新的方法,在「單排列雜湊」資料草圖上運算特徵和區段估計值。 此新方法產生的變異數低於積木相似度的標準估計器。 請參閱下節,瞭解使用此方法的報表。
使用取樣資料的報表 reports-using-sampled-data
使用統計抽樣資料和Minhash抽樣方法的Audience Manager報表包括:
統計抽樣
Minhash取樣方法
Data Explorer在Search索引標籤和任何Saved Searches中使用抽樣資料
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695