Sintesi della metodologia di campionamento utilizzata per alcune relazioni, tassi di errore di campionamento e un elenco di relazioni che restituiscono informazioni basate sui dati campionati.
Alcuni Audience Manager i rapporti visualizzano i risultati in base a un set campionato della quantità totale di dati disponibili. Il rapporto tra i dati campionati è di 1:54. Per i rapporti che utilizzano dati campionati, ciò significa che i risultati si basano su 1 record su ogni set di 54 record.
Questi rapporti utilizzano dati statistici campionati perché hanno bisogno di una quantità enorme di potenza di elaborazione per generare risultati. Il campionamento consente di trovare un equilibrio tra la riduzione delle esigenze di elaborazione, il mantenimento delle prestazioni del sistema e la fornitura di risultati accurati.
Nei rapporti che generano dati di sovrapposizione possono verificarsi errori. Un errore è definito come la percentuale di record che:
È importante notare che i nostri test e modelli mostrano che il tasso di errore diminuzioni in proporzione inversa al numero di record nel set di dati. I set di dati con un numero elevato di record generano meno errori rispetto ai set con un numero limitato di record. Vediamo questa affermazione in modo più quantitativo. Come mostrato nella tabella seguente, per un determinato numero di record, il 95% dei risultati del rapporto sarà inferiore a un tasso di errore specifico.
Numero di record | Frequenza errori |
---|---|
500 - 1,000 | Il 95% è al di sotto di un tasso di errore del 42%. |
1,000 - 1,500 | Il 95% è al di sotto di un tasso di errore del 34%. |
10,000 - 50,000 | Il 95% è al di sotto di un tasso di errore del 14%. |
50,000 | Il 95% è al di sotto di un tasso di errore del 6%. |
100,000 | Il 95% è al di sotto di un tasso di errore del 4%. |
500.000 (o più) | Il 95% è al di sotto di un tasso di errore del 2%. |
In base al Minhash metodologia di campionamento, Audience Manager utilizza un nuovo metodo per calcolare i stimatori di caratteristiche e segmenti sopra uno schizzo di dati con hash a una permutazione. Questo nuovo metodo produce una varianza inferiore rispetto allo stimatore standard per la somiglianza Jaccard. Consulta la sezione seguente per i rapporti che utilizzano questa metodologia.
Il Audience Manager i rapporti che utilizzano i dati statistici campionati e la metodologia di campionamento Minhash includono:
Campionamento statistico | Metodologia di campionamento Minhash |
---|---|
Pubblico di riferimento dati (dati a livello di cliente e di segmento). | Rapporti di sovrapposizione (da caratteristica a caratteristica, da segmento a caratteristica e da segmento a segmento) |
Il Dispositivi totali metrica per un Profile Merge Rule. | Raccomandazioni sulle caratteristiche |
Data Explorer utilizza i dati campionati in Search e qualsiasi Saved Searches | Audience Marketplace Recommendations |