Muestreo de datos y tasas de error en los informes de Audience Manager seleccionado

Resumen de la metodología de muestreo utilizada para algunos informes, tasas de error de muestreo y una lista de informes que devuelven información basada en los datos incluidos en la muestra.

Proporción de muestreo de datos

Algunos informes Audience Manager muestran los resultados en función de un conjunto muestreado de la cantidad total de datos disponibles. La proporción de datos de muestra es 1:54. Para los informes que utilizan datos de muestra, esto significa que los resultados se basan en 1 registro de cada conjunto de 54 registros.

Estos informes utilizan datos estadísticos muestreados porque necesitan una gran cantidad de potencia informática para generar resultados. El muestreo ayuda a lograr un equilibrio entre la reducción de las demandas computacionales, el mantenimiento del rendimiento del sistema y la obtención de resultados precisos.

Tasas de error

Pueden producirse errores en los informes que generan datos de superposición. Un error se define como el porcentaje de registros que:

  • No debería haberse incluido en un informe, pero se habían agregado de todas formas.
  • Debían haberse incluido en un informe, pero se habían dejado de lado.

Es importante tener en cuenta que nuestras pruebas y modelos muestran que la tasa de error disminuye en una proporción inversa al número de registros del conjunto de datos. Los conjuntos de datos que tienen muchos registros generan menos errores que los conjuntos con un pequeño número de registros. Veamos esta afirmación de una manera más cuantitativa. Como se muestra en la tabla siguiente, para un número determinado de registros, el 95 % de los resultados del informe estarán por debajo de una tasa de error específica.

Número de registros Tasa de error
500 - 1.000 El 95 % está por debajo de una tasa de error del 42 %.
De 1.000 a 1.500 El 95 % está por debajo de una tasa de error del 34 %.
De 10.000 a 50.000 El 95 % está por debajo de una tasa de error del 14 %.
50 000 El 95 % está por debajo de una tasa de error del 6 %.
100.000 El 95 % está por debajo de una tasa de error del 4 %.
500 000 (o más) El 95 % está por debajo de una tasa de error del 2 %.

Uso de la metodología de muestreo de Minhash

Basándose en la metodología de muestreo Minhash, el Audience Manager utiliza un nuevo método para calcular los estimadores de rasgos y segmentos además de un boceto de datos hash de una permutación. Este nuevo método produce una varianza inferior a la del estimador estándar para la similitud Jaccard. Consulte la sección siguiente para ver los informes que utilizan esta metodología.

Informes que utilizan datos mostrados

Los Audience Manager informes que utilizan datos estadísticos muestreados y la metodología de muestreo Minhash incluyen:

Muestreo estadístico Metodología de muestreo de minerales
Datos de audiencias a las que se puede dirigir (datos de nivel de cliente y segmento). Informes de superposición (rasgo a rasgo, segmento a rasgo y segmento a segmento)
La métrica Dispositivos totales para un Profile Merge Rule. Recomendaciones de rasgos
Data Explorer utiliza datos de muestra en la Search pestaña y cualquier Saved Searches Audience Marketplace Recommendations

En esta página