Datainsamling och felfrekvens i valda rapporter för Audience Manager data-sampling-and-error-rates-in-selected-audience-manager-reports

En sammanfattning av den provtagningsmetod som används för vissa rapporter, felfrekvenser vid provtagning och en lista över rapporter som returnerar information baserat på provdata.

Samplingsförhållande för data data-sampling-ratio

Några Audience Manager rapporter visar resultat som bygger på en uppsättning provbilder av den totala mängden tillgängliga data. Samplade data-förhållandet är 1:54. För rapporter där exempeldata används innebär detta att resultaten baseras på 1 post av varje uppsättning med 54 poster.

Dessa rapporter använder statistiska provdata eftersom de behöver en enorm mängd datorkraft för att generera resultat. Sampling hjälper till att hitta en balans mellan minskade datorkrav, bibehållna systemprestanda och ge korrekta resultat.

Felfrekvens error-rates

Fel kan uppstå i rapporter som genererar överlappande data. Ett fel definieras som procentandelen poster som:

  • Bör inte ha inkluderats i en rapport men har ändå lagts till.
  • Bör ha tagits med i en rapport men utelämnats.

Observera att våra tester och modeller visar att felfrekvensen minskning i en omvänd proportion till antalet poster i datauppsättningen. Datauppsättningar med många poster genererar färre fel än uppsättningar med ett litet antal poster. Låt oss titta på detta påstående mer kvantitativt. Som framgår av följande tabell kommer 95 % av rapportresultaten att ligga under en viss felfrekvens för ett visst antal poster.

Antal poster
Felfrekvens
500 - 1,000
95 % har en felfrekvens på 42 %.
1,000 - 1,500
95 % har en felfrekvens på 34 %.
10,000 - 50,000
95 % har en felfrekvens på 14 %.
50,000
95 % har en felfrekvens på 6 %.
100,000
95 % har en felfrekvens på 4 %.
500 000 (eller fler)
95 % har en felfrekvens på 2 %.

Använda metoden för Minhash-provtagning minhash

Baserat på Minhash samplingsmetod använder Audience Manager en ny metod för att beräkna trait- och segmentuppskattare ovanpå en enpermutation-hashing-dataskiss. Den här nya metoden ger en lägre varians än standarduppskattaren för Jaccard-likhet. Se avsnittet nedan för de rapporter som använder denna metod.

Rapporter som använder provdata reports-using-sampled-data

The Audience Manager Rapporter som använder statistiska provdata och metoden för Minhash-provtagning omfattar följande:

Statistisk sampling
Provtagningsmetod för minhash
Mottagande målgrupp data (data på kund- och segmentnivå).
Överlappa rapporter (trait-to-trait, segment-to-trait och segment-to-segment)
The Totalt antal enheter mått för Profile Merge Rule.
Trait-rekommendationer
Data Explorer använder exempeldata i Search och alla Saved Searches
Audience Marketplace Recommendations
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695