Muestreo de datos y tasas de error en informes de Audience Manager seleccionados data-sampling-and-error-rates-in-selected-audience-manager-reports

Resumen de la metodología de muestreo utilizada para algunos informes, tasas de error de muestreo y lista de informes que devuelven información basada en datos muestreados.

Proporción de muestreo de datos data-sampling-ratio

Algunos informes de Audience Manager muestran los resultados basándose en un conjunto muestreado de la cantidad total de datos disponibles. La proporción de datos muestreados es de 1:54. En el caso de los informes que utilizan datos de ejemplo, los resultados se basan en 1 registro de cada conjunto de 54 registros.

Estos informes utilizan datos estadísticos muestreados porque necesitan una enorme cantidad de potencia de cálculo para generar resultados. El muestreo ayuda a lograr un equilibrio entre la reducción de las demandas informáticas, el mantenimiento del rendimiento del sistema y la obtención de resultados precisos.

Tasas de error error-rates

Pueden producirse errores en los informes que generan datos de superposición. Un error se define como el porcentaje de registros que:

  • No deberían haberse incluido en un informe, pero se agregaron de todos modos.
  • Debería haberse incluido en un informe, pero no se ha incluido.

Es importante tener en cuenta que nuestras pruebas y modelos muestran que la tasa de error disminuye en una proporción inversa al número de registros del conjunto de datos. Los conjuntos de datos que tienen muchos registros generan menos errores que los conjuntos con un pequeño número de registros. Veamos esta afirmación de una manera más cuantitativa. Como se muestra en la tabla siguiente, para un número determinado de registros, el 95 % de los resultados del informe se encontrarán por debajo de una tasa de error específica.

Número de registros
Tasa de error
De 500 a 1.000
El 95 % tiene una tasa de error inferior al 42 %.
De 1.000 a 1.500
El 95 % tiene una tasa de error inferior al 34 %.
De 10.000 a 50.000
El 95 % tiene una tasa de error inferior al 14 %.
50 000
El 95 % tiene una tasa de error inferior al 6 %.
100.000
El 95 % tiene una tasa de error inferior al 4 %.
500.000 (o más)
El 95 % tiene una tasa de error inferior al 2 %.

Uso de la metodología de muestreo Minhash minhash

Basado en la metodología de muestreo Minhash, Audience Manager usa un nuevo método para calcular los estimadores de rasgos y segmentos sobre un boceto de datos hash de permutación única. Este nuevo método produce una variación menor que el estimador estándar para la similitud de Jaccard. Consulte la sección siguiente para ver los informes que utilizan esta metodología.

Informes que utilizan datos de ejemplo reports-using-sampled-data

Los informes de Audience Manager que usan datos estadísticos muestreados y la metodología de muestreo Minhash incluyen:

Muestreo estadístico
Metodología de muestreo de Minhash
Datos de Audiencia direccionable (datos de nivel de cliente y de segmento).
Informes de superposición (de característica a característica, de segmento a característica y de segmento a segmento)
La métrica Dispositivos totales para un(a) Profile Merge Rule.
Recomendaciones de rasgos
Data Explorer usa datos muestreados en la ficha Search y en cualquier Saved Searches
Recommendations Audience Marketplace
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695