Campionamento di dati e tassi di errore nei report di Audienci Manager selezionati data-sampling-and-error-rates-in-selected-audience-manager-reports

Sintesi della metodologia di campionamento utilizzata per alcune relazioni, tassi di errore di campionamento e un elenco di relazioni che restituiscono informazioni basate sui dati campionati.

Rapporto di campionamento dei dati data-sampling-ratio

Alcuni rapporti di Audience Manager visualizzano i risultati in base a un set campionato della quantità totale di dati disponibili. Il rapporto tra i dati campionati è di 1:54. Per i rapporti che utilizzano dati campionati, ciò significa che i risultati si basano su 1 record su ogni set di 54 record.

Questi rapporti utilizzano dati statistici campionati perché hanno bisogno di una quantità enorme di potenza di elaborazione per generare risultati. Il campionamento consente di trovare un equilibrio tra la riduzione delle esigenze di elaborazione, il mantenimento delle prestazioni del sistema e la fornitura di risultati accurati.

Tassi di errore error-rates

Nei rapporti che generano dati di sovrapposizione possono verificarsi errori. Un errore è definito come la percentuale di record che:

  • Non avrebbero dovuto essere inclusi in un rapporto, ma sono stati aggiunti comunque.
  • Avrebbe dovuto essere incluso in un report ma è stato escluso.

È importante notare che i nostri test e modelli mostrano che il tasso di errore diminuisce in modo inverso rispetto al numero di record nel set di dati. I set di dati con un numero elevato di record generano meno errori rispetto ai set con un numero limitato di record. Vediamo questa affermazione in modo più quantitativo. Come mostrato nella tabella seguente, per un determinato numero di record, il 95% dei risultati del rapporto sarà inferiore a un tasso di errore specifico.

Numero di record
Frequenza errori
500 - 1.000
Il 95% è al di sotto di un tasso di errore del 42%.
1.000 - 1.500
Il 95% è al di sotto di un tasso di errore del 34%.
10.000 - 50.000
Il 95% è al di sotto di un tasso di errore del 14%.
50.000
Il 95% è al di sotto di un tasso di errore del 6%.
100.000
Il 95% è al di sotto di un tasso di errore del 4%.
500.000 (o più)
Il 95% è al di sotto di un tasso di errore del 2%.

Utilizzo della metodologia di campionamento Minhash minhash

In base alla metodologia di campionamento Minhash, Audience Manager utilizza un nuovo metodo per calcolare i stimatori di caratteristiche e segmenti sopra uno schizzo di dati con hash a una permutazione. Questo nuovo metodo produce una varianza inferiore rispetto allo stimatore standard per la somiglianza Jaccard. Consulta la sezione seguente per i rapporti che utilizzano questa metodologia.

Rapporti Che Utilizzano Dati Campionati reports-using-sampled-data

I report Audience Manager che utilizzano i dati statistici campionati e la metodologia di campionamento Minhash includono:

Campionamento statistico
Metodologia di campionamento Minhash
Dati del pubblico indirizzabile (dati a livello di cliente e segmento).
Rapporti di sovrapposizione (da caratteristica a caratteristica, da segmento a caratteristica e da segmento a segmento)
La metrica Dispositivi totali per un Profile Merge Rule.
Raccomandazioni sulle caratteristiche
Data Explorer utilizza i dati campionati nella scheda Search e in qualsiasi Saved Searches
Audience Marketplace Recommendations
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695