Parameter für die Protokollverarbeitung

Links zu weiteren Informationen über bestimmte Parameter in der Datei "Log Processing.cfg".

Datenfilter

Die in der Datei Log Processing.cfg definierten Filter umfassen Folgendes:

  • Endzeit
  • Hashschwellenwert
  • Startzeit

Die von diesen Parametern definierte Filterung erfolgt, nachdem Protokolleinträge die Dekodierer verlassen haben und nach Transformationen, aber vor deren Auswertung durch das Log Entry Condition. Im Allgemeinen führt eine Änderung dieser Parameter zu Änderungen der Zusammensetzung des Datensatzes.

Die empfohlene Methode für die Verwendung von Sensor-Datenquellen zum Erstellen eines Datensatzes, der einen bestimmten Zeitraum abdeckt, ist die Verwendung der Parameter "Beginn Time"und "End Time"für den Datensatz.

Die Verwendung der Parameter "Beginn-Zeit"und "Endzeit"wird anderen Verfahren vorgezogen, z. B. dem Verschieben von Protokolldateien, um sie nach Ordner zu trennen. Durch Festlegen der Beginns- und Endzeiten für den Datensatz verwendet der Data Workbench-Server automatisch nur die Protokolleinträge, die innerhalb des angegebenen Intervalls erfolgten. Wenn die Endzeit in der Vergangenheit liegt, aktualisiert der Data Workbench-Server den Datensatz in der Regel mit demselben Satz von Protokolleinträgen, selbst wenn der Datensatz beispielsweise durch Hinzufügen einer neuen Transformation aktualisiert wird.

Protokolleintrag

Im Wesentlichen handelt es sich dabei um einen Filtervorgang für die verfügbaren Protokolleinträge. Wenn Log Entry Condition den Wert false zurückgibt, wird der Protokolleintrag aus dem verfügbaren Satz der Protokolleinträge herausgefiltert.

Das Log Entry Condition wird mithilfe von Bedingungsvorgängen beschrieben (siehe Conditions) und kann eines der Eingabefelder verwenden, die von Sensor erfasst werden (siehe Data Workbench Sensor Guide ) oder alle erweiterten Felder, die durch Konvertierungen in der Log Processing.cfg-Datei erzeugt werden, um die Testbedingungen zu definieren. Log Entry werden während der Protokollverarbeitung angewendet und können optional während der Transformation angewendet werden.

Dieses Beispiel zeigt die Verwendung von log entry condition für Website-Daten. Mit dem Log Entry Condition können Sie Datasets erstellen, die sich auf einen bestimmten Bereich der Website konzentrieren, oder Besucher, die bestimmte Aktionen auf der Site ausführen.

Das Log Entry Condition in diesem Beispiel erstellt einen Datensatz, der nur die Protokolleinträge enthält, die Teil des Site-Speichers sind. Wenn Sie das RECondition test-Feld mit dem entsprechenden Muster “/store/.*” und das cs-uri-stem-Feld als Eingabe für den regulären Ausdruck verwenden, werden nur Webseiten mit dem Beginn “/store/” in den Datensatz aufgenommen.

Tastenteilung

Die Anzahl der Tracking-IDs im Datensatz wird künstlich erhöht, aber die Gesamtzahl der vom Data Workbench-Server verarbeiteten Protokolleinträge wird nicht künstlich erhöht, wodurch die Gesamtzahl der zählbaren Ereignis im Datensatz erhalten bleibt. Nachdem die Daten für ein einzelnes Element aufgeteilt wurden, sind die Daten für immer mit zwei verschiedenen Tracking-IDs verknüpft und können nicht zugeordnet werden.

Wenn Sie beispielsweise mit Webdaten arbeiten, stellt jede Tracking-ID einen eindeutigen Besucher dar. Wenn Sie die Schlüsselaufteilung aktivieren, werden die Besucher im Datensatz mit großen Mengen von Ereignis-Daten in mehrere Besucher aufgeteilt. Während die Anzahl der Besucher im Datensatz künstlich erhöht wird, wird die Gesamtzahl zählbarer Ereignis wie Ansichten oder Buchungen nicht künstlich erhöht. Nach der Aufteilung können die Daten für die Unter-Besucher nicht zugeordnet werden.

Schlüsselaufteilung verwendet einen probabilistischen Algorithmus. Infolgedessen besteht ein Kompromiss zwischen der Speicherbelegung, der Ausfallwahrscheinlichkeit, dem Schwellenwert für die Schlüsselaufteilung ( Split Key Bytes) und der Datensatzgröße. Bei den empfohlenen Einstellungen (wie unten aufgeführt) ist die Fehlerquote niedrig. Von den Elementen, deren Ereignis-Daten den Schwellenwert für die Schlüsselaufteilung überschreiten, werden etwa 1 von 22.000 (in der Regel weniger als 1 pro Datensatz) ihre Daten abgeschnitten statt aufgeteilt.

Die empfohlenen Werte für jeden Parameter (ohne und mit Schlüsselaufteilung) sind in der folgenden Tabelle aufgeführt.

Parameter Keine Schlüsselaufteilung Schlüsselaufteilung
Gruppen - Maximale Schlüsselbyte 1e6 2e6
Schlüsselraum teilen 6e6 6e6
Schlüsselbyte teilen 0 1e6
Schlüsselabstand teilen 10 10

Group Maximum Key Bytes gibt an, wie viele Ereignis-Daten maximal für eine einzige Tracking-ID verarbeitet werden können. Daten, die diesen Grenzwert überschreiten, werden aus dem Dataset-Aufbau gefiltert. Split Key Bytes die Anzahl der Bytes, bei denen eine einzelne Tracking-ID in mehrere Elemente aufgeteilt wird. Elemente werden entsprechend einer Wahrscheinlichkeitsverteilung bei etwa dieser Anzahl von Byte aufgeteilt. Split Key Space Ratio und Split Key Bucket Space steuern Sie die Speichernutzung und die Fehlerquote der Tastenaufteilung.

HINWEIS

Group Maximum Key Bytes, Split Key Bytes, Split Key Space Ratio und Split Key Bucket Space alle müssen deklariert werden, damit die Schlüsselteilung ordnungsgemäß funktioniert. Ändern Sie die Werte dieser Parameter nicht ohne vorherige Adobe.

Auf dieser Seite

Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now