Daten-Sampling und Fehlerraten in ausgewählten Audience Manager-Berichten data-sampling-and-error-rates-in-selected-audience-manager-reports
Eine Zusammenfassung der für einige Berichte verwendeten Stichprobenmethodik, Stichprobenfehlerraten und eine Liste von Berichten, die Informationen auf der Grundlage von Stichprobendaten liefern.
Daten-Sampling-Verhältnis data-sampling-ratio
Einige Audience Manager -Berichte zeigen Ergebnisse basierend auf einem Stichprobensatz der insgesamt verfügbaren Datenmenge an. Das Datenverhältnis der Stichprobe beträgt 1:54. Für Berichte, die Stichprobendaten verwenden, bedeutet dies, dass Ihre Ergebnisse auf 1 Datensatz aus jedem Satz von 54 Datensätzen basieren.
Diese Berichte verwenden Daten aus statistischen Stichproben, da sie eine enorme Rechenleistung benötigen, um Ergebnisse zu erzielen. Das Sampling hilft, ein Gleichgewicht zwischen reduzierten Rechenanforderungen, der Aufrechterhaltung der Systemleistung und der Bereitstellung genauer Ergebnisse zu finden.
Fehlerraten error-rates
Fehler können in Berichten auftreten, die Überlagerungsdaten generieren. Ein Fehler ist definiert als der Prozentsatz an Datensätzen, die:
- Hätte nicht in einen Bericht aufgenommen, aber trotzdem hinzugefügt werden sollen.
- Sollte in einen Bericht aufgenommen, aber nicht berücksichtigt werden.
Beachten Sie, dass unsere Tests und Modelle zeigen, dass die Fehlerrate im umgekehrten Verhältnis zur Anzahl der Datensätze in Ihrem Datensatz abnimmt. Datensätze mit vielen Datensätzen erzeugen weniger Fehler als Datensätze mit einer geringen Datensatzanzahl. Sehen wir uns diese Behauptung quantitativer an. Wie in der folgenden Tabelle dargestellt, liegen 95 % der Berichtsergebnisse bei einer bestimmten Anzahl von Datensätzen unter einer bestimmten Fehlerrate.
Verwenden der Minhash-Sampling-Methode minhash
Basierend auf der Sampling-Methode Minhash verwendet Audience Manager eine neuartige Methode, um Eigenschaften- und Segmentschätzungen über einer Datenskizze vom Typ One Permutation Hashing zu berechnen. Diese neue Methode erzeugt eine geringere Varianz als der Standardschätzer für die Ähnlichkeit von Jaccard. Im folgenden Abschnitt finden Sie die Berichte, die diese Methode verwenden.
Berichte mit Stichprobendaten reports-using-sampled-data
Die Audience Manager -Berichte, die statistische Stichprobendaten verwenden, und die Minhash-Stichprobenmethode umfassen: