선택한 Audience Manager 보고서의 데이터 샘플링 및 오류율

일부 보고서, 샘플링 오류율 및 샘플링된 데이터를 기반으로 정보를 반환하는 보고서 목록에 사용된 샘플링 방법론의 요약입니다.

데이터 샘플링 비율

일부 Audience Manager 보고서는 사용 가능한 총 데이터 양의 샘플링된 세트를 기반으로 결과를 표시합니다. 샘플링된 데이터 비율은 1:54입니다. 샘플링된 데이터를 사용하는 보고서의 경우, 결과는 54개의 레코드 집합 중 1개의 레코드를 기반으로 합니다.

이러한 보고서는 결과를 생성하는 데 막대한 컴퓨팅 능력이 필요하기 때문에 통계적으로 샘플링된 데이터를 사용합니다. 샘플링을 통해 컴퓨터 요구 사항을 줄이고 시스템 성능을 유지하고 정확한 결과를 얻을 수 있습니다.

오류율

중복 데이터를 생성하는 보고서에서 오류가 발생할 수 있습니다. 오류는 다음과 같은 레코드의 백분율로 정의됩니다.

  • 보고서에 포함되지 말았어야 했지만 어쨌든 추가되었습니다.
  • 보고서에 포함했어야 하는데 제외됐거든요

테스트 및 모델에서 오류 비율 이 데이터 세트의 레코드 수에 대한 역비례로​이 감소한다는 것을 나타낸다는 것을 유의해야 합니다. 레코드가 많은 데이터 세트는 레코드 수가 적은 세트보다 오류가 적게 발생합니다. 이 주장을 보다 정량적으로 살펴보자. 다음 표에 표시된 대로 레코드 집합에 대해 보고서 결과의 95%가 특정 오류율 아래에 있습니다.

레코드 수 오류율
500 - 1,000 95%는 42% 오류율 이하입니다.
1,000 - 1,500 95%는 34% 오류율 이하입니다.
10,000 - 50,000 95%는 14% 오류율 이하입니다.
50,000 95%는 6% 오류율 이하입니다.
100,000 95%는 4% 오류율 이하입니다.
500,000(이상) 95%는 2% 오류율 이하입니다.

Minhash 샘플링 방법론 사용

Minhash 샘플링 방법론을 기반으로, Audience Manager은 새로운 방법을 사용하여 1개의 퍼뮤테이션 해시 데이터 스케치 위에 트레이트 및 세그먼트 견적 도구를 계산합니다. 이 새 방법은 표준 유사성에 대한 견적 도구보다 낮은 분산을 생성합니다. 이 방법을 사용하는 보고서에 대해서는 아래 섹션을 참조하십시오.

샘플링된 데이터 를 사용하는 보고서

통계적 샘플링 데이터 및 Minhash 샘플링 방법을 사용하는 Audience Manager 보고서에는 다음이 포함됩니다.

통계적 샘플링 Minhash 샘플링 방법론
대응 가능 대상 데이터(고객 및 세그먼트 수준 데이터). Overlap Reports (특성-특성, 세그먼트-특성 및 세그먼트-세그먼트)
Profile Merge Rule에 대한 총 장치 지표. 트레이트 추천
Data Explorer는 Search 탭 및 Saved Searches Recommendations Audience Marketplace

이 페이지에서는