Datainsamling och felfrekvens i rapporter för markerade Audience Manager data-sampling-and-error-rates-in-selected-audience-manager-reports

En sammanfattning av den provtagningsmetod som används för vissa rapporter, felfrekvenser vid provtagning och en lista över rapporter som returnerar information baserat på provdata.

Samplingsförhållande för data data-sampling-ratio

Vissa Audience Manager-rapporter visar resultat baserat på en provuppsättning av den totala mängden tillgängliga data. Samplade data-förhållandet är 1:54. För rapporter där exempeldata används innebär detta att resultaten baseras på 1 post av varje uppsättning med 54 poster.

Dessa rapporter använder statistiska provdata eftersom de behöver en enorm mängd datorkraft för att generera resultat. Sampling hjälper till att hitta en balans mellan minskade datorkrav, bibehållna systemprestanda och ge korrekta resultat.

Felfrekvens error-rates

Fel kan uppstå i rapporter som genererar överlappande data. Ett fel definieras som procentandelen poster som:

  • Bör inte ha inkluderats i en rapport men har ändå lagts till.
  • Bör ha tagits med i en rapport men utelämnats.

Observera att våra tester och modeller visar att felfrekvensen minskar i en omvänd proportion till antalet poster i datauppsättningen. Datauppsättningar med många poster genererar färre fel än uppsättningar med ett litet antal poster. Låt oss titta på detta påstående mer kvantitativt. Som framgår av följande tabell kommer 95 % av rapportresultaten att ligga under en viss felfrekvens för ett visst antal poster.

Antal poster
Felfrekvens
500 - 1 000
95 % har en felfrekvens på 42 %.
1 000 - 1 500
95 % har en felfrekvens på 34 %.
10 000 - 50 000
95 % har en felfrekvens på 14 %.
50 000
95 % har en felfrekvens på 6 %.
100 000
95 % har en felfrekvens på 4 %.
500 000 (eller fler)
95 % har en felfrekvens på 2 %.

Använda metoden för Minhash-provtagning minhash

Baserat på Minhash -samplingsmetoden använder Audience Manager en ny metod för att beräkna trait- och segmentuppskattare ovanpå en One Permutation Hashing-dataskiss. Den här nya metoden ger en lägre varians än standarduppskattaren för Jaccard-likhet. Se avsnittet nedan för de rapporter som använder denna metod.

Rapporter som använder provdata reports-using-sampled-data

Audience Manager-rapporterna som använder statistiska provdata och metoden för Minhash-provtagning omfattar:

Statistisk sampling
Provtagningsmetod för minhash
Adresserbara målgruppsdata (data på kund- och segmentnivå).
Överlappningsrapporter (trait-to-trait, segment-to-trait och segment-to-segment)
Måttet Totalt antal enheter för en Profile Merge Rule.
Trait-rekommendationer
Data Explorer använder exempeldata på fliken Search och alla Saved Searches
Audience Marketplace Recommendations
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695