Daten-Sampling und Fehlerraten in ausgewählten Audience Manager-Berichten

Eine Zusammenfassung der für einige Berichte verwendeten Stichprobenmethodik, Stichprobenfehlerquoten und eine Liste von Berichten, die Informationen basierend auf Stichprobendaten zurückgeben.

Datenstichprobenverhältnis

Einige Audience Manager Berichte zeigen Ergebnisse basierend auf einem Stichprobensatz der insgesamt verfügbaren Daten an. Das Stichprobendatenverhältnis beträgt 1:54. Bei Berichten, die Stichprobendaten verwenden, basieren Ihre Ergebnisse auf einem Datensatz aus jeweils 54 Datensätzen.

Diese Berichte verwenden Daten aus statistischen Stichproben, weil sie eine enorme Rechenleistung benötigen, um Ergebnisse zu erzielen. Die Probenahme hilft dabei, ein Gleichgewicht zwischen geringeren Rechenanforderungen, der Aufrechterhaltung der Systemleistung und der Bereitstellung präziser Ergebnisse herzustellen.

Fehlerquoten

Fehler können in Berichten auftreten, die überlappende Daten generieren. Ein Fehler wird definiert als der Prozentsatz der Datensätze, die:

  • Hätte nicht in einen Bericht aufgenommen, aber trotzdem hinzugefügt werden sollen.
  • Hätte in einen Bericht aufgenommen werden sollen, aber nicht berücksichtigt.

Beachten Sie, dass unsere Tests und Modelle zeigen, dass die Fehlerquote im umgekehrten Verhältnis zur Anzahl der Datensätze in Ihrem Datensatz sinkt . Datensätze mit vielen Datensätzen führen zu weniger Fehlern als Datensätze mit einer geringen Anzahl von Datensätzen. Betrachten wir diese Behauptung quantitativer. Wie in der folgenden Tabelle dargestellt, liegen 95 % Ihrer Berichtsergebnisse bei einer bestimmten Anzahl von Datensätzen unter einer bestimmten Fehlerquote.

Anzahl der Datensätze Fehlerquote
500 - 1,000 95 % weisen eine Fehlerquote von 42 % auf.
1,000 - 1,500 95 % weisen eine Fehlerquote von 34 % auf.
10,000 - 50,000 95 % weisen eine Fehlerquote von 14 % auf.
50.000 95 % weisen eine Fehlerquote von 6 % auf.
100,000 95 % weisen eine Fehlerquote von 4 % auf.
500.000 (oder mehr) 95 % weisen eine Fehlerquote von 2 % auf.

Verwenden der Minhash-Stichprobenmethode

Auf der Grundlage der Minhash -Stichprobenmethode verwendet Audience Manager eine neuartige Methode, um Eigenschaften- und Segmentaussagen auf einer Datenskizze mit One Permutation Hashing zu berechnen. Diese neue Methode erzeugt eine geringere Varianz als die Standardschätzung für die Ähnlichkeit mit Jaccard. Die Berichte, die diese Methode verwenden, finden Sie im folgenden Abschnitt.

Berichte, die Beispieldaten verwenden

Zu den Audience Manager Berichten mit statistischen Stichprobendaten und der Minhash-Stichprobenmethode gehören:

Statistische Stichproben Minhash-Stichprobenmethode
Addressable Audience Data (Daten auf Kunden- und Segmentebene). Überschneidungsberichte (Eigenschaften in Eigenschaften, Segmente in Eigenschaften und Segmente in Segmente)
Die Metrik Geräte insgesamt für einen Profile Merge Rule. Eigenschaftenempfehlungen
Data Explorer verwendet Stichprobendaten auf der Search Registerkarte und beliebige Saved Searches Audience Marketplace Recommendations

Auf dieser Seite