Datasampling en foutpercentages in geselecteerde Audience Manager-rapporten data-sampling-and-error-rates-in-selected-audience-manager-reports

Een samenvatting van de steekproefmethode die voor sommige rapporten wordt gebruikt, foutenpercentages van de steekproef, en een lijst van rapporten die informatie terugkeren die op bemonsterde gegevens wordt gebaseerd.

Bemonsteringsverhouding gegevens data-sampling-ratio

Sommige Audience Manager de rapporten tonen resultaten die op een bemonsterde reeks van de totale hoeveelheid beschikbare gegevens worden gebaseerd. De gegevensverhouding in het monster is 1:54. Voor rapporten die bemonsterde gegevens gebruiken, betekent dit uw resultaten op 1 verslag van elke reeks 54 verslagen worden gebaseerd.

Deze rapporten gebruiken statistische gesamplede gegevens omdat ze een enorme hoeveelheid verwerkingskracht nodig hebben om resultaten te genereren. Bemonstering helpt een evenwicht te vinden tussen lagere computervereisten, het handhaven van systeemprestaties en het verstrekken van nauwkeurige resultaten.

Foutpercentages error-rates

Er kunnen fouten optreden in rapporten die overlappende gegevens genereren. Een fout wordt gedefinieerd als het percentage records dat:

  • Was niet in een rapport opgenomen maar toch toegevoegd.
  • Het had in een verslag moeten worden opgenomen, maar het werd weggelaten.

Het is belangrijk om op te merken dat onze tests en modellen aantonen dat het foutenpercentage dalingen in omgekeerde verhouding tot het aantal records in uw gegevensset. Gegevenssets met veel records genereren minder fouten dan gegevenssets met een klein aantal records. Laten we deze bewering op een meer kwantitatieve manier bekijken. Zoals getoond in de volgende lijst, voor een bepaald aantal verslagen, zal 95% van uw rapportresultaten onder een specifiek foutenpercentage zijn.

Aantal records
Foutfrequentie
500 - 1,000
95% is lager dan een 42%-foutenpercentage.
1,000 - 1,500
95% is lager dan een foutpercentage van 34%.
10,000 - 50,000
95% is lager dan een foutpercentage van 14%.
50,000
95% is lager dan een foutenpercentage van 6%.
100,000
95% is lager dan een foutpercentage van 4%.
500.000 (of meer)
95% is lager dan een foutpercentage van 2%.

De methode voor het nemen van minihashmonsters gebruiken minhash

Op basis van de Minhash Audience Manager gebruikt een nieuwe methode voor het berekenen van kenmerken en segmentschattingen boven op een gegevensschets One Permutation Hashing. Deze nieuwe methode produceert een lagere variantie dan de standaardschatter voor gelijkenis Jaccard. Zie de volgende sectie voor de rapporten die deze methodologie gebruiken.

Rapporten waarin voorbeeldgegevens worden gebruikt reports-using-sampled-data

De Audience Manager rapporten waarin gebruik wordt gemaakt van statistische bemonsterde gegevens en de methode voor het nemen van monsters van minihash:

Statistische bemonstering
Methode voor het nemen van minihash
Adresseerbaar publiek gegevens (gegevens op klant- en segmentniveau).
Rapporten overlappen (eigenschap-aan-pas, segment-aan-pas, en segment-aan-segment)
De Totaal aantal apparaten metrisch voor een Profile Merge Rule.
Trait Recommendations
Data Explorer gebruikt gesamplede gegevens in de Search en alle Saved Searches
Audience Marketplace Recommendations
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695