所選Audience Manager報表中的資料取樣和錯誤率 data-sampling-and-error-rates-in-selected-audience-manager-reports

用於某些報表的取樣方法摘要、取樣錯誤率,以及根據取樣資料傳回資訊的報表清單。

資料取樣比例 data-sampling-ratio

有些Audience Manager報告會根據可用資料總量的取樣集來顯示結果。 取樣資料比率為1:54。 對於使用取樣資料的報表,這表示您的結果以54筆記錄每組1筆記錄為基礎。

這些報表使用統計抽樣資料,因為它們需要大量運算能力才能產生結果。 取樣有助於在減少的運算需求、維持系統效能以及提供精確的結果之間取得平衡。

錯誤率 error-rates

產生重疊資料的報表中可能會發生錯誤。 錯誤定義為記錄中符合以下條件的百分比:

  • 本來不應該納入報表,但還是被新增了。
  • 應該包含在報表中,但卻被排除在外。

請注意,我們的測試和模型顯示錯誤率​ 會減少,與資料集中的記錄數成反比。 含有大量記錄的資料集所產生的錯誤會比含有少量記錄的資料集少。 讓我們以更定量的方式檢視此判斷提示。 如下表所示,對於一組記錄,95%的報告結果將低於特定錯誤率。

記錄數
錯誤率
500 - 1,000
95%的錯誤率低於42%。
1,000 - 1,500
95%的錯誤率低於34%。
10,000 - 50,000
95%的錯誤率低於14%。
50,000
95%的錯誤率低於6%。
100,000
95%的錯誤率低於4%。
500,000 (或更多)
95%的錯誤率低於2%。

使用Minhash取樣方法 minhash

根據Minhash取樣方法,Audience Manager使用新的方法,在「單排列雜湊」資料草圖上運算特徵和區段估計值。 此新方法產生的變異數低於積木相似度的標準估計器。 請參閱下節,瞭解使用此方法的報表。

使用取樣資料的報表 reports-using-sampled-data

使用統計抽樣資料和Minhash抽樣方法的Audience Manager報表包括:

統計抽樣
Minhash取樣方法
可定址的受眾資料(客戶和區段層級資料)。
重疊報表 (特徵對特徵、區段對特徵、區段對區段)
Profile Merge Rule的總裝置量度。
特徵建議
Data Explorer在Search索引標籤和任何Saved Searches中使用抽樣資料
Audience MarketplaceRecommendations
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695