Un resumen de la metodología de muestreo utilizada para algunos informes, las tasas de error de muestreo y una lista de informes que devuelven información basada en datos de muestra.
Algunos informes Audience Manager muestran resultados basados en un conjunto muestreado de la cantidad total de datos disponibles. La proporción de datos de muestra es 1:54. Para los informes que utilizan datos de muestra, esto significa que los resultados se basan en un registro de cada conjunto de 54 registros.
Estos informes utilizan datos estadísticos de muestra porque necesitan una enorme capacidad informática para generar resultados. El muestreo ayuda a encontrar un equilibrio entre la reducción de las demandas computacionales, el mantenimiento del rendimiento del sistema y la obtención de resultados precisos.
Pueden producirse errores en los informes que generan datos de superposición. Un error se define como el porcentaje de registros que:
Es importante tener en cuenta que nuestras pruebas y modelos muestran que la tasa de error disminuye en una proporción inversa a la cantidad de registros del conjunto de datos. Los conjuntos de datos que tienen muchos registros generan menos errores que los conjuntos con un pequeño número de registros. Veamos esta afirmación de una manera más cuantitativa. Como se muestra en la siguiente tabla, para un número determinado de registros, el 95% de los resultados del informe estarán por debajo de una tasa de error específica.
Número de registros | Tasa de error |
---|---|
500 - 1.000 | El 95 % está por debajo de una tasa de error del 42 %. |
De 1.000 a 1.500 | El 95 % está por debajo de una tasa de error del 34 %. |
10.000 - 50.000 | El 95 % está por debajo de una tasa de error del 14 %. |
50 000 | El 95 % está por debajo de una tasa de error del 6 %. |
100.000 | El 95 % está por debajo de una tasa de error del 4 %. |
500.000 (o más) | El 95 % está por debajo de una tasa de error del 2 %. |
Según la metodología de muestreo Minhash, el Audience Manager utiliza un método novedoso para calcular los estimadores de características y segmentos sobre un esbozo de datos con hash de una permutación. Este nuevo método produce una varianza inferior a la del estimador estándar para la similitud de Jaccard. Consulte la sección siguiente para ver los informes que utilizan esta metodología.
Los informes Audience Manager que utilizan datos estadísticos de muestra y la metodología de muestreo Minhash incluyen:
Muestreo estadístico | Metodología de muestreo de minerales |
---|---|
Datos de audiencia direccionables (datos a nivel de cliente y segmento). | Superponer informes (rasgo a rasgo, segmento a rasgo y segmento a segmento) |
La métrica Dispositivos totales para un Profile Merge Rule. | Recomendaciones de rasgos |
Data Explorer utiliza datos de muestra en la Search ficha y en cualquier Saved Searches | Audience Marketplace Recommendations |