Datenstichproben und Fehlerquoten in Berichten zu ausgewählten Audience Managern data-sampling-and-error-rates-in-selected-audience-manager-reports

Eine Zusammenfassung der für einige Berichte verwendeten Stichprobenmethodik, Stichprobenfehlerraten und eine Liste von Berichten, die Informationen auf der Grundlage von Stichprobendaten zurückgeben.

Verhältnis von Datenabtastung data-sampling-ratio

Einige Audience Manager zeigen Ergebnisse basierend auf einem Stichprobensatz der Gesamtmenge der verfügbaren Daten an. Das Verhältnis der abgetasteten Daten beträgt 1:54. Für Berichte, die Stichprobendaten verwenden, bedeutet dies, dass Ihre Ergebnisse auf einem Datensatz aus jedem Satz von 54 Datensätzen basieren.

Diese Berichte verwenden statistische Stichprobendaten, da sie eine enorme Rechenleistung benötigen, um Ergebnisse zu generieren. Das Sampling hilft, ein Gleichgewicht zwischen reduzierten Rechenanforderungen, Aufrechterhaltung der Systemleistung und Bereitstellung genauer Ergebnisse zu finden.

Fehlerquoten error-rates

Fehler können in Berichten auftreten, die Überschneidungsdaten generieren. Ein Fehler wird als Prozentsatz der Datensätze definiert, die:

  • Sollte nicht in einem Bericht enthalten sein, wurde aber trotzdem hinzugefügt.
  • Sie hätten in einen Bericht aufgenommen werden müssen, wurden aber nicht berücksichtigt.

Beachten Sie, dass unsere Tests und Modelle zeigen, dass die Fehlerrate sinkt umgekehrt proportional zur Anzahl der Datensätze in Ihrem Datensatz ist. Datensätze mit vielen Datensätzen generieren weniger Fehler als Datensätze mit einer geringen Anzahl von Datensätzen. Sehen wir uns diese Behauptung quantitativ an. Wie in der folgenden Tabelle gezeigt, liegen 95 % der Berichtsergebnisse für eine bestimmte Anzahl von Datensätzen unter einer bestimmten Fehlerrate.

Anzahl Datensätze
Fehlerrate
500 - 1.000
95 % liegen unter einer Fehlerquote von 42 %.
1.000 - 1.500
Bei 95 % liegt die Fehlerquote unter 34 %.
10.000 - 50.000
95 % liegen unter einer Fehlerquote von 14 %.
50.000
95 % liegen unter einer Fehlerquote von 6 %.
100.000
95 % liegen unter einer Fehlerquote von 4 %.
500.000 (oder mehr)
95 % liegen unter einer Fehlerquote von 2 %.

Verwenden der Minhash-Stichprobenmethode minhash

Basierend auf der Minhash-Stichprobenmethode verwendet Audience Manager eine neuartige Methode zur Berechnung von Eigenschaften- und Segmentschätzungen auf der Grundlage einer Datenskizze mit einem Permutations-Hashing. Diese neue Methode erzeugt eine niedrigere Varianz als die Standardschätzung für die Jaccard-Ähnlichkeit. Im folgenden Abschnitt finden Sie die Berichte, die diese Methode verwenden.

Berichte, die Beispieldaten verwenden reports-using-sampled-data

Die Audience Manager Berichte, die statistische Stichprobendaten und die Minhash-Stichprobenmethode verwenden, umfassen Folgendes:

Statistische Stichprobenziehung
Minhash-Stichprobenmethode
Adressierbare) (Daten auf Kunden- und Segmentebene).
Überschneidungsberichte (Eigenschaft-zu-Eigenschaft, Segment-zu-Eigenschaft und Segment-zu-Segment)
Die Gesamtzahl der Geräte für eine Profile Merge Rule.
Eigenschaftenempfehlungen
Data Explorer verwendet auf der Registerkarte "Search" und in allen Saved Searches abgetastete Daten
Audience Marketplace Recommendations
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695