Sintesi della metodologia di campionamento utilizzata per alcuni rapporti, tassi di errore di campionamento e elenco dei rapporti che restituiscono informazioni basate su dati campionati.
Alcuni report Audience Manager mostrano risultati basati su un set campionato della quantità totale di dati disponibili. Il rapporto dei dati campionati è di 1:54. Per i rapporti che utilizzano dati campionati, ciò significa che i risultati sono basati su 1 record su ogni set di 54 record.
Questi rapporti utilizzano dati statistici campionati perché hanno bisogno di un'enorme quantità di potenza di calcolo per generare risultati. Il campionamento aiuta a trovare un equilibrio tra la riduzione delle richieste di calcolo, il mantenimento delle prestazioni del sistema e la fornitura di risultati precisi.
Nei rapporti che generano dati di sovrapposizione possono verificarsi errori. Un errore è definito come la percentuale di record che:
È importante notare che i nostri test e modelli mostrano che il tasso di errore diminuisce in proporzione inversa rispetto al numero di record nel set di dati. I set di dati con molti record generano meno errori rispetto ai set con un numero ridotto di record. Guardiamo questa affermazione in modo più quantitativo. Come mostrato nella tabella seguente, per un determinato numero di record, il 95% dei risultati del rapporto sarà inferiore a un tasso di errore specifico.
Numero di record | Frequenza errori |
---|---|
500 - 1.000 | Il 95% è al di sotto di un tasso di errore del 42%. |
1.000 - 1.500 | Il 95% è al di sotto di un tasso di errore del 34%. |
10.000 - 50.000 | Il 95% è al di sotto di un tasso di errore del 14%. |
50.000 | Il 95% è al di sotto di un tasso di errore del 6%. |
100.000 | Il 95% è al di sotto di un tasso di errore del 4%. |
500.000 (o più) | Il 95% è al di sotto di un tasso di errore del 2%. |
Sulla base della metodologia di campionamento Minhash , Audience Manager utilizza un nuovo metodo per calcolare le caratteristiche e i calcolatori dei segmenti sopra uno sketch di dati di hash di una permutazione. Questo nuovo metodo produce una varianza inferiore rispetto al calcolatore standard per la somiglianza Jaccard. Vedi la sezione seguente per i rapporti che utilizzano questa metodologia.
I rapporti Audience Manager che utilizzano dati statistici campionati e la metodologia di campionamento di hash includono:
Campionamento statistico | Metodologia di campionamento del minhash |
---|---|
Tipi di pubblico indirizzabili (dati a livello di cliente e segmento). | Rapporti di sovrapposizione (da caratteristica a caratteristica, da segmento a caratteristica e da segmento a segmento) |
La metrica Dispositivi totali per un elemento Profile Merge Rule. | Raccomandazioni sulle caratteristiche |
Data Explorer utilizza i dati campionati nella Search scheda ed eventuali Saved Searches | Audience Marketplace Recommendations |