Campionamento di dati e tassi di errore nei report selezionati di Audience Manager

Sintesi della metodologia di campionamento utilizzata per alcuni rapporti, tassi di errore di campionamento e elenco dei rapporti che restituiscono informazioni basate su dati campionati.

Rapporto di campionamento dei dati

Alcuni report Audience Manager mostrano risultati basati su un set campionato della quantità totale di dati disponibili. Il rapporto dei dati campionati è di 1:54. Per i rapporti che utilizzano dati campionati, ciò significa che i risultati sono basati su 1 record su ogni set di 54 record.

Questi rapporti utilizzano dati statistici campionati perché hanno bisogno di un'enorme quantità di potenza di calcolo per generare risultati. Il campionamento aiuta a trovare un equilibrio tra la riduzione delle richieste di calcolo, il mantenimento delle prestazioni del sistema e la fornitura di risultati precisi.

Tassi di errore

Nei rapporti che generano dati di sovrapposizione possono verificarsi errori. Un errore è definito come la percentuale di record che:

  • Non avrebbe dovuto essere incluso in un rapporto ma sarebbe stato comunque aggiunto.
  • Avrebbe dovuto essere incluso in un rapporto, ma è stato escluso.

È importante notare che i nostri test e modelli mostrano che il tasso di errore diminuisce in proporzione inversa rispetto al numero di record nel set di dati. I set di dati con molti record generano meno errori rispetto ai set con un numero ridotto di record. Guardiamo questa affermazione in modo più quantitativo. Come mostrato nella tabella seguente, per un determinato numero di record, il 95% dei risultati del rapporto sarà inferiore a un tasso di errore specifico.

Numero di record Frequenza errori
500 - 1.000 Il 95% è al di sotto di un tasso di errore del 42%.
1.000 - 1.500 Il 95% è al di sotto di un tasso di errore del 34%.
10.000 - 50.000 Il 95% è al di sotto di un tasso di errore del 14%.
50.000 Il 95% è al di sotto di un tasso di errore del 6%.
100.000 Il 95% è al di sotto di un tasso di errore del 4%.
500.000 (o più) Il 95% è al di sotto di un tasso di errore del 2%.

Utilizzo della metodologia di campionamento dei hash

Sulla base della metodologia di campionamento Minhash , Audience Manager utilizza un nuovo metodo per calcolare le caratteristiche e i calcolatori dei segmenti sopra uno sketch di dati di hash di una permutazione. Questo nuovo metodo produce una varianza inferiore rispetto al calcolatore standard per la somiglianza Jaccard. Vedi la sezione seguente per i rapporti che utilizzano questa metodologia.

Rapporti che utilizzano dati di esempio

I rapporti Audience Manager che utilizzano dati statistici campionati e la metodologia di campionamento di hash includono:

Campionamento statistico Metodologia di campionamento del minhash
Tipi di pubblico indirizzabili (dati a livello di cliente e segmento). Rapporti di sovrapposizione (da caratteristica a caratteristica, da segmento a caratteristica e da segmento a segmento)
La metrica Dispositivi totali per un elemento Profile Merge Rule. Raccomandazioni sulle caratteristiche
Data Explorer utilizza i dati campionati nella Search scheda ed eventuali Saved Searches Audience Marketplace Recommendations

In questa pagina

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now