Datasampling en foutpercentages in geselecteerde Audience Manager-rapporten :headding-anchor:data-sampling-and-error-rates-in-selected-audience-manager-reports
Een samenvatting van de steekproefmethode die voor sommige rapporten wordt gebruikt, foutenpercentages van de steekproef, en een lijst van rapporten die informatie terugkeren die op bemonsterde gegevens wordt gebaseerd.
Bemonsteringsverhouding gegevens :headding-anchor:data-sampling-ratio
Sommige Audience Manager de rapporten tonen resultaten die op een bemonsterde reeks van de totale hoeveelheid beschikbare gegevens worden gebaseerd. De gegevensverhouding in het monster is 1:54. Voor rapporten die bemonsterde gegevens gebruiken, betekent dit uw resultaten op 1 verslag van elke reeks 54 verslagen worden gebaseerd.
Deze rapporten gebruiken statistische gesamplede gegevens omdat ze een enorme hoeveelheid verwerkingskracht nodig hebben om resultaten te genereren. Bemonstering helpt een evenwicht te vinden tussen lagere computervereisten, het handhaven van systeemprestaties en het verstrekken van nauwkeurige resultaten.
Foutpercentages :headding-anchor:error-rates
Er kunnen fouten optreden in rapporten die overlappende gegevens genereren. Een fout wordt gedefinieerd als het percentage records dat:
- Was niet in een rapport opgenomen maar toch toegevoegd.
- Het had in een verslag moeten worden opgenomen, maar het werd weggelaten.
Het is belangrijk om op te merken dat onze tests en modellen aantonen dat het foutenpercentage dalingen in omgekeerde verhouding tot het aantal records in uw gegevensset. Gegevenssets met veel records genereren minder fouten dan gegevenssets met een klein aantal records. Laten we deze bewering op een meer kwantitatieve manier bekijken. Zoals getoond in de volgende lijst, voor een bepaald aantal verslagen, zal 95% van uw rapportresultaten onder een specifiek foutenpercentage zijn.
De methode voor het nemen van minihashmonsters gebruiken :headding-anchor:minhash
Op basis van de Minhash Audience Manager gebruikt een nieuwe methode voor het berekenen van kenmerken en segmentschattingen boven op een gegevensschets One Permutation Hashing. Deze nieuwe methode produceert een lagere variantie dan de standaardschatter voor gelijkenis Jaccard. Zie de volgende sectie voor de rapporten die deze methodologie gebruiken.
Rapporten waarin voorbeeldgegevens worden gebruikt :headding-anchor:reports-using-sampled-data
De Audience Manager rapporten waarin gebruik wordt gemaakt van statistische bemonsterde gegevens en de methode voor het nemen van monsters van minihash: