Gegevensbemonstering en foutenpercentages in geselecteerde Audience Manager-rapporten data-sampling-and-error-rates-in-selected-audience-manager-reports

Een samenvatting van de steekproefmethode die voor sommige rapporten wordt gebruikt, foutenpercentages van de steekproef, en een lijst van rapporten die informatie terugkeren die op bemonsterde gegevens wordt gebaseerd.

Bemonsteringsverhouding gegevens data-sampling-ratio

Sommige Audience Manager -rapporten geven resultaten weer op basis van een gesamplede set van de totale hoeveelheid beschikbare gegevens. De bemonsterde gegevensverhouding is 1 :54. Voor rapporten die bemonsterde gegevens gebruiken, betekent dit uw resultaten op 1 verslag van elke reeks 54 verslagen worden gebaseerd.

Deze rapporten gebruiken statistische gesamplede gegevens omdat ze een enorme hoeveelheid verwerkingskracht nodig hebben om resultaten te genereren. Bemonstering helpt een evenwicht te vinden tussen lagere computervereisten, het handhaven van systeemprestaties en het verstrekken van nauwkeurige resultaten.

Foutpercentages error-rates

Er kunnen fouten optreden in rapporten die overlappende gegevens genereren. Een fout wordt gedefinieerd als het percentage records dat:

  • Was niet in een rapport opgenomen maar toch toegevoegd.
  • Het had in een verslag moeten worden opgenomen, maar het werd weggelaten.

Het is belangrijk om op te merken dat onze tests en modellen tonen dat het foutentarief ** in een omgekeerde verhouding aan het aantal verslagen in uw gegevensreeks vermindert. Gegevenssets met veel records genereren minder fouten dan gegevenssets met een klein aantal records. Laten we deze bewering op een meer kwantitatieve manier bekijken. Zoals getoond in de volgende lijst, voor een bepaald aantal verslagen, zal 95% van uw rapportresultaten onder een specifiek foutenpercentage zijn.

Aantal records
Foutfrequentie
500 - 1.000
95% is lager dan een 42%-foutenpercentage.
1.000 - 1.500
95% is lager dan een foutpercentage van 34%.
10.000 - 50.000
95% is lager dan een foutpercentage van 14%.
50.000
95% is lager dan een foutenpercentage van 6%.
100.000
95% is lager dan een foutpercentage van 4%.
500.000 (of meer)
95% is lager dan een foutpercentage van 2%.

De methode voor het nemen van minihashmonsters gebruiken minhash

Gebaseerd op de minihashsteekproefmethodologie, gebruikt Audience Manager een nieuwe methode om eigenschap en segmentschatters bovenop een Één Permutatie het gegevensschets van het Hakken van de Permutatie te berekenen. Deze nieuwe methode produceert een lagere variantie dan de standaardschatter voor gelijkenis Jaccard. Zie de volgende sectie voor de rapporten die deze methodologie gebruiken.

Rapporten waarin voorbeeldgegevens worden gebruikt reports-using-sampled-data

De rapporten van Audience Manager die statistische bemonsterde gegevens en de Minhash steekproefmethodologie gebruiken omvatten:

Statistische bemonstering
Methode voor het nemen van minihash
Adressable Gegevens van het publiek(klant en segment-vlakke gegevens).
overlap rapporten(spoor-aan-spoor, segment-aan-spoor, en segment-aan-segment)
Totale Apparatenmetrisch voor a Profile Merge Rule.
Trait Recommendations
Data Explorergebruikt bemonsterde gegevens in het Search lusje en om het even welk Saved Searches
de Aanbevelingen van Audience Marketplace
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695