일부 보고서, 샘플링 오류율 및 샘플링된 데이터를 기반으로 정보를 반환하는 보고서 목록에 사용된 샘플링 방법론의 요약입니다.
일부 Audience Manager 보고서는 사용 가능한 총 데이터 양의 샘플링된 세트를 기반으로 결과를 표시합니다. 샘플링된 데이터 비율은 1:54입니다. 샘플링된 데이터를 사용하는 보고서의 경우, 결과는 54개의 레코드 집합 중 1개의 레코드를 기반으로 합니다.
이러한 보고서는 결과를 생성하는 데 막대한 컴퓨팅 능력이 필요하기 때문에 통계적으로 샘플링된 데이터를 사용합니다. 샘플링을 통해 컴퓨터 요구 사항을 줄이고 시스템 성능을 유지하고 정확한 결과를 얻을 수 있습니다.
중복 데이터를 생성하는 보고서에서 오류가 발생할 수 있습니다. 오류는 다음과 같은 레코드의 백분율로 정의됩니다.
테스트 및 모델에서 오류 비율 이 데이터 세트의 레코드 수에 대한 역비례로이 감소한다는 것을 나타낸다는 것을 유의해야 합니다. 레코드가 많은 데이터 세트는 레코드 수가 적은 세트보다 오류가 적게 발생합니다. 이 주장을 보다 정량적으로 살펴보자. 다음 표에 표시된 대로 레코드 집합에 대해 보고서 결과의 95%가 특정 오류율 아래에 있습니다.
레코드 수 | 오류율 |
---|---|
500 - 1,000 | 95%는 42% 오류율 이하입니다. |
1,000 - 1,500 | 95%는 34% 오류율 이하입니다. |
10,000 - 50,000 | 95%는 14% 오류율 이하입니다. |
50,000 | 95%는 6% 오류율 이하입니다. |
100,000 | 95%는 4% 오류율 이하입니다. |
500,000(이상) | 95%는 2% 오류율 이하입니다. |
Minhash 샘플링 방법론을 기반으로, Audience Manager은 새로운 방법을 사용하여 1개의 퍼뮤테이션 해시 데이터 스케치 위에 트레이트 및 세그먼트 견적 도구를 계산합니다. 이 새 방법은 표준 유사성에 대한 견적 도구보다 낮은 분산을 생성합니다. 이 방법을 사용하는 보고서에 대해서는 아래 섹션을 참조하십시오.
통계적 샘플링 데이터 및 Minhash 샘플링 방법을 사용하는 Audience Manager 보고서에는 다음이 포함됩니다.
통계적 샘플링 | Minhash 샘플링 방법론 |
---|---|
대응 가능 대상 데이터(고객 및 세그먼트 수준 데이터). | Overlap Reports (특성-특성, 세그먼트-특성 및 세그먼트-세그먼트) |
Profile Merge Rule에 대한 총 장치 지표. | 트레이트 추천 |
Data Explorer는 Search 탭 및 Saved Searches | Recommendations Audience Marketplace |