Échantillonnage des données et taux d’erreur dans les rapports Audience Manager sélectionnés data-sampling-and-error-rates-in-selected-audience-manager-reports
Un résumé de la méthodologie d’échantillonnage utilisée pour certains rapports, les taux d’erreur d’échantillonnage et une liste des rapports qui renvoient des informations basées sur des données échantillonnées.
Rapport d’échantillonnage de données data-sampling-ratio
Certains rapports Audience Manager affichent des résultats en fonction d’un ensemble échantillonné de la quantité totale de données disponibles. Le rapport de données échantillonné est de 1:54. Pour les rapports qui utilisent des données échantillonnées, cela signifie que vos résultats sont basés sur 1 enregistrement sur chaque ensemble de 54 enregistrements.
Ces rapports utilisent des données statistiques échantillonnées car ils ont besoin d’une énorme puissance de calcul pour générer des résultats. L’échantillonnage permet de trouver un équilibre entre la réduction des exigences de calcul, le maintien des performances du système et la fourniture de résultats précis.
Taux d’erreurs error-rates
Des erreurs peuvent se produire dans les rapports qui génèrent des données de chevauchement. Une erreur est définie comme le pourcentage d’enregistrements qui :
- N’aurait pas dû être inclus dans un rapport, mais a été ajouté de toute façon.
- Ils auraient dû être inclus dans un rapport, mais ont été exclus.
Il est important de noter que nos tests et modèles montrent que le taux d’erreur diminue en proportion inverse du nombre d’enregistrements dans votre jeu de données. Les jeux de données contenant un grand nombre d’enregistrements génèrent moins d’erreurs que les jeux contenant un petit nombre d’enregistrements. Examinons cette assertion d'une manière plus quantitative. Comme le montre le tableau suivant, pour un nombre défini d’enregistrements, 95 % des résultats de votre rapport seront inférieurs à un taux d’erreur spécifique.
Utilisation de la méthodologie d’échantillonnage Minhash minhash
Basée sur la méthodologie d’échantillonnage Minhash, Audience Manager utilise une nouvelle méthode pour calculer les estimateurs de caractéristiques et de segments en plus d’une esquisse de données de hachage à une permutation. Cette nouvelle méthode produit une variance inférieure à l'estimateur standard pour la similarité de Jaccard. Voir la section ci-dessous pour connaître les rapports qui utilisent cette méthodologie.
Rapports Qui Utilisent Des Données Échantillonnées reports-using-sampled-data
Les rapports Audience Manager qui utilisent des données statistiques échantillonnées et la méthodologie d’échantillonnage de Minhash incluent :