Campionamento di dati e tassi di errore nei report di Audienci Manager selezionati data-sampling-and-error-rates-in-selected-audience-manager-reports
Sintesi della metodologia di campionamento utilizzata per alcune relazioni, tassi di errore di campionamento e un elenco di relazioni che restituiscono informazioni basate sui dati campionati.
Rapporto di campionamento dei dati data-sampling-ratio
Alcuni rapporti di Audience Manager visualizzano i risultati in base a un set campionato della quantità totale di dati disponibili. Il rapporto tra i dati campionati è di 1:54. Per i rapporti che utilizzano dati campionati, ciò significa che i risultati si basano su 1 record su ogni set di 54 record.
Questi rapporti utilizzano dati statistici campionati perché hanno bisogno di una quantità enorme di potenza di elaborazione per generare risultati. Il campionamento consente di trovare un equilibrio tra la riduzione delle esigenze di elaborazione, il mantenimento delle prestazioni del sistema e la fornitura di risultati accurati.
Tassi di errore error-rates
Nei rapporti che generano dati di sovrapposizione possono verificarsi errori. Un errore è definito come la percentuale di record che:
- Non avrebbero dovuto essere inclusi in un rapporto, ma sono stati aggiunti comunque.
- Avrebbe dovuto essere incluso in un report ma è stato escluso.
È importante notare che i nostri test e modelli mostrano che il tasso di errore diminuisce in modo inverso rispetto al numero di record nel set di dati. I set di dati con un numero elevato di record generano meno errori rispetto ai set con un numero limitato di record. Vediamo questa affermazione in modo più quantitativo. Come mostrato nella tabella seguente, per un determinato numero di record, il 95% dei risultati del rapporto sarà inferiore a un tasso di errore specifico.
Utilizzo della metodologia di campionamento Minhash minhash
In base alla metodologia di campionamento Minhash, Audience Manager utilizza un nuovo metodo per calcolare i stimatori di caratteristiche e segmenti sopra uno schizzo di dati con hash a una permutazione. Questo nuovo metodo produce una varianza inferiore rispetto allo stimatore standard per la somiglianza Jaccard. Consulta la sezione seguente per i rapporti che utilizzano questa metodologia.
Rapporti Che Utilizzano Dati Campionati reports-using-sampled-data
I report Audience Manager che utilizzano i dati statistici campionati e la metodologia di campionamento Minhash includono: