摘要說明用於某些報表的取樣方法、取樣錯誤率,以及根據取樣資料傳回資訊的報表清單。
有些Audience Manager報表會根據可用資料總量的取樣集來顯示結果。 採樣資料比為1:54。 對於使用取樣資料的報表,這表示您的結果是以每54個記錄集中的1個記錄為基礎。
這些報表使用統計取樣資料,因為它們需要大量的運算能力才能產生結果。 採樣有助於在減少的計算需求、維持系統效能和提供精確結果之間取得平衡。
產生重疊資料的報表中可能會發生錯誤。 錯誤定義為:
請務必注意,我們的測試和模型顯示錯誤率以與資料集中記錄數成反比的比例減少。 具有大量記錄的資料集產生的錯誤比具有少量記錄的資料集少。 讓我們以更為定量的方式來看一下這一論斷。 如下表所示,若是一組記錄,95%的報表結果將低於特定錯誤率。
記錄數 | 錯誤率 |
---|---|
500 - 1,000 | 95%的錯誤率低於42%。 |
1,000 - 1,500 | 95%的錯誤率為34%。 |
1~5萬 | 95%的錯誤率低於14%。 |
50,000 | 95%的錯誤率低於6%。 |
十萬 | 95%的錯誤率低於4%。 |
500,000(或以上) | 95%的錯誤率低於2%。 |
基於Minhash採樣方法,Audience Manager在單置換散列資料草圖上使用一種新的方法來計算特徵和分段估計。 該方法比標準Jaccard相似度估計器產生的方差小。 請參閱以下章節,瞭解使用此方法的報表。
Audience Manager報表使用統計取樣資料和Minhash取樣方法,包括:
統計抽樣 | Minhash抽樣方法 |
---|---|
可定 址的受眾資料(客戶和群體層級資料)。 | 重疊報表 (特徵對特徵、區段對特徵和區段對區段) |
Profile Merge Rule的「裝置總數」量度。 | 特徵建議 |
Data Search Explorer會在標籤和任何 Saved Searches | Audience MarketplaceRecommendations |