Eine Zusammenfassung der für einige Berichte verwendeten Stichprobenmethodik, Stichprobenfehlerraten und eine Liste von Berichten, die Informationen auf der Grundlage von Stichprobendaten liefern.
Einige Audience Manager -Berichte zeigen Ergebnisse basierend auf einem Stichprobensatz der insgesamt verfügbaren Datenmenge an. Das Datenverhältnis der Stichprobe beträgt 1:54. Für Berichte, die Stichprobendaten verwenden, bedeutet dies, dass Ihre Ergebnisse auf 1 Datensatz aus jedem Satz von 54 Datensätzen basieren.
Diese Berichte verwenden Daten aus statistischen Stichproben, da sie eine enorme Rechenleistung benötigen, um Ergebnisse zu erzielen. Das Sampling hilft, ein Gleichgewicht zwischen reduzierten Rechenanforderungen, der Aufrechterhaltung der Systemleistung und der Bereitstellung genauer Ergebnisse zu finden.
Fehler können in Berichten auftreten, die Überlagerungsdaten generieren. Ein Fehler ist definiert als der Prozentsatz der Datensätze, die:
Beachten Sie, dass unsere Tests und Modelle zeigen, dass die Fehlerrate um einen umgekehrten Anteil an der Anzahl der Datensätze in Ihrem Datensatz abnimmt. Datensätze mit vielen Datensätzen erzeugen weniger Fehler als Datensätze mit einer geringen Anzahl von Datensätzen. Sehen wir uns diese Behauptung quantitativer an. Wie in der folgenden Tabelle dargestellt, liegen 95 % der Berichtsergebnisse bei einer bestimmten Datensatzanzahl unter einer bestimmten Fehlerrate.
Anzahl Datensätze | Fehlerrate |
---|---|
500-1.000 | 95 % weisen eine Fehlerrate von 42 % auf. |
1.000-1.500 | 95 % weisen eine Fehlerrate von 34 % auf. |
10.000 - 50.000 | 95 % weisen eine Fehlerrate von 14 % auf. |
50.000 | 95 % weisen eine Fehlerrate von 6 % auf. |
100.000 | 95 % weisen eine Fehlerrate von 4 % auf. |
500.000 (oder mehr) | 95 % weisen eine Fehlerrate von 2 % auf. |
Basierend auf der Sampling-Methode Minhash verwendet Audience Manager eine neuartige Methode, um Eigenschaften- und Segmentschätzungen auf einer Datenskizze "One Permutation Hashing"zu berechnen. Diese neue Methode erzeugt eine geringere Varianz als der Standardschätzer für die Ähnlichkeit von Jaccard. Im folgenden Abschnitt finden Sie die Berichte, die diese Methode verwenden.
Zu den Audience Manager-Berichten, die statistische Stichprobendaten und die Minhash-Stichprobenmethode verwenden, gehören:
Statistische Auswahl | Minhash-Sampling-Methode |
---|---|
Addressable Audiences (Daten auf Kunden- und Segmentebene). | Überlagerungsberichte (Eigenschaft zu Eigenschaft, Segment zu Eigenschaft und Segment zu Segment) |
Die Metrik Geräte insgesamt für Profile Merge Rule. | Eigenschaftenempfehlungen |
Data Explorer verwendet gesampelte Daten im Search Tab und beliebige Saved Searches | Audience Marketplace Recommendations |