Daten-Sampling und Fehlerraten in ausgewählten Audience Manager-Berichten data-sampling-and-error-rates-in-selected-audience-manager-reports

Eine Zusammenfassung der für einige Berichte verwendeten Stichprobenmethodik, Stichprobenfehlerraten und eine Liste von Berichten, die Informationen auf der Grundlage von Stichprobendaten liefern.

Daten-Sampling-Verhältnis data-sampling-ratio

Einige Audience Manager -Berichte zeigen Ergebnisse basierend auf einem Stichprobensatz der insgesamt verfügbaren Datenmenge an. Das Datenverhältnis der Stichprobe beträgt 1:54. Für Berichte, die Stichprobendaten verwenden, bedeutet dies, dass Ihre Ergebnisse auf 1 Datensatz aus jedem Satz von 54 Datensätzen basieren.

Diese Berichte verwenden Daten aus statistischen Stichproben, da sie eine enorme Rechenleistung benötigen, um Ergebnisse zu erzielen. Das Sampling hilft, ein Gleichgewicht zwischen reduzierten Rechenanforderungen, der Aufrechterhaltung der Systemleistung und der Bereitstellung genauer Ergebnisse zu finden.

Fehlerraten error-rates

Fehler können in Berichten auftreten, die Überlagerungsdaten generieren. Ein Fehler ist definiert als der Prozentsatz an Datensätzen, die:

  • Hätte nicht in einen Bericht aufgenommen, aber trotzdem hinzugefügt werden sollen.
  • Sollte in einen Bericht aufgenommen, aber nicht berücksichtigt werden.

Beachten Sie, dass unsere Tests und Modelle zeigen, dass die Fehlerrate im umgekehrten Verhältnis zur Anzahl der Datensätze in Ihrem Datensatz abnimmt. Datensätze mit vielen Datensätzen erzeugen weniger Fehler als Datensätze mit einer geringen Datensatzanzahl. Sehen wir uns diese Behauptung quantitativer an. Wie in der folgenden Tabelle dargestellt, liegen 95 % der Berichtsergebnisse bei einer bestimmten Anzahl von Datensätzen unter einer bestimmten Fehlerrate.

Anzahl Datensätze
Fehlerrate
500-1.000
95 % weisen eine Fehlerrate von 42 % auf.
1.000-1.500
95 % weisen eine Fehlerrate von 34 % auf.
10.000 - 50.000
95 % weisen eine Fehlerrate von 14 % auf.
50.000
95 % weisen eine Fehlerrate von 6 % auf.
100.000
95 % weisen eine Fehlerrate von 4 % auf.
500.000 (oder mehr)
95 % weisen eine Fehlerrate von 2 % auf.

Verwenden der Minhash-Sampling-Methode minhash

Basierend auf der Sampling-Methode Minhash verwendet Audience Manager eine neuartige Methode, um Eigenschaften- und Segmentschätzungen über einer Datenskizze vom Typ One Permutation Hashing zu berechnen. Diese neue Methode erzeugt eine geringere Varianz als der Standardschätzer für die Ähnlichkeit von Jaccard. Im folgenden Abschnitt finden Sie die Berichte, die diese Methode verwenden.

Berichte mit Stichprobendaten reports-using-sampled-data

Die Audience Manager -Berichte, die statistische Stichprobendaten verwenden, und die Minhash-Stichprobenmethode umfassen:

Statistische Auswahl
Minhash-Sampling-Methode
Addressable Audience -Daten (Daten auf Kunden- und Segmentebene).
Überlagerungsberichte (Eigenschaften-zu-Eigenschaften-, Segment-zu-Merkmal- und Segment-zu-Segment-Berichte)
Die Metrik Geräte insgesamt für einen Wert Profile Merge Rule.
Eigenschaftenempfehlungen
Data Explorer verwendet gesampelte Daten auf der Registerkarte Search und beliebige Saved Searches
Audience Marketplace Recommendations
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695