Campionamento di dati e tassi di errore nei report selezionati di Audience Manager

Riepilogo della metodologia di campionamento utilizzata per alcuni rapporti, tassi di errore di campionamento e un elenco di rapporti che restituiscono informazioni basate su dati campionati.

Rapporto di campionamento dei dati

Alcuni report Audience Manager mostrano risultati basati su un set campionato della quantità totale di dati disponibili. Il rapporto dei dati campionati è di 1:54. Per i report che utilizzano dati campionati, i risultati sono basati su 1 record su ogni set di 54 record.

Questi report utilizzano dati statistici campionati perché necessitano di una quantità enorme di potenza di calcolo per generare risultati. Il campionamento aiuta a trovare un equilibrio tra la riduzione delle richieste di calcolo, il mantenimento delle prestazioni del sistema e la fornitura di risultati accurati.

Tassi di errore

Gli errori possono verificarsi nei report che generano dati di sovrapposizione. Un errore è definito come la percentuale di record che:

  • Non avrebbe dovuto essere incluso in un rapporto ma sarebbe stato comunque aggiunto.
  • Avrebbe dovuto essere incluso in una relazione, ma sono stati esclusi.

È importante notare che i nostri test e modelli mostrano che il tasso di errore diminuisce in proporzione inversa rispetto al numero di record nel set di dati. I set di dati con molti record generano meno errori rispetto ai set con un numero limitato di record. Guardiamo a questa affermazione in modo più quantitativo. Come mostrato nella tabella seguente, per un numero impostato di record, il 95% dei risultati del rapporto sarà inferiore a un tasso di errore specifico.

Numero di record Frequenza errori
500 - 1.000 Il 95% è inferiore a un tasso di errore del 42%.
1.000 - 1.500 Il 95% è inferiore a un tasso di errore del 34%.
10.000 - 50.000 Il 95% è inferiore a un tasso di errore del 14%.
50.000 Il 95% è inferiore a un tasso di errore del 6%.
100.000 Il 95% è inferiore a un tasso di errore del 4%.
500.000 (o più) Il 95% è inferiore a un tasso di errore del 2%.

Utilizzo della metodologia di campionamento dei minhash

Sulla base della metodologia di campionamento Minhash, Audience Manager utilizza un nuovo metodo per calcolare le caratteristiche e gli stimatori del segmento sopra a uno sketch di dati con hash di una singola conversione. Questo nuovo metodo produce una varianza inferiore rispetto allo stimatore standard per la similarità con Jaccard. Consulta la sezione seguente per i report che utilizzano questa metodologia.

Report che utilizzano dati di esempio

I report Audience Manager che utilizzano i dati statistici campionati e la metodologia di campionamento Minhash includono:

Campionamento statistico Metodologia di campionamento del minhash
Dati audience indirizzabili (dati a livello di cliente e segmento). Report di sovrapposizione (caratteristiche, caratteristiche e caratteristiche e segmento a segmento)
La metrica Dispositivi totali per un Profile Merge Rule. Raccomandazioni sulle caratteristiche
Data Explorer utilizza i dati campionati nella Search scheda ed eventuali Saved Searches Recommendations Audience Marketplace

In questa pagina