Textdatei-Decoder-Gruppen

Die Verarbeitung von Protokolldateien als Protokollquellen erfordert die Definition eines Decoders in der Datensatzaufnahme-Datei zur Protokollverarbeitung, um Datenfelder aus den Protokolleinträgen zu extrahieren.

Die Definition von Textdatei-Decoder-Gruppen für Protokolldateiquellen erfordert Kenntnisse über die Struktur und den Inhalt der Protokolldatei, die zu extrahierenden Daten und die Felder, in denen diese Daten gespeichert werden. Dieser Abschnitt enthält grundlegende Beschreibungen der Parameter, die Sie für Decoder angeben können. Die Art und Weise, in der Sie Decoder verwenden, hängt jedoch von der Protokolldatei ab, die Ihre Quelldaten enthält.

Informationen zu den Formatanforderungen für Protokolldateiquellen finden Sie unter Protokolldateien. Wenden Sie sich zur Unterstützung bei der Definition von Textdatei-Decodern an die Adobe.

Eine Textdatei-Decoder-Gruppe kann Folgendes umfassen:

Reguläre Ausdruck-Decoders

Ein Decoder für reguläre Ausdrücke identifiziert komplexe Zeichenfolgenmuster in den Protokolleinträgen in einer Protokolldatei und extrahiert diese Muster als Datenfelder. Die Anzahl der Felder muss für jeden Decoder der Anzahl der erfassten Untermuster im regulären Ausdruck entsprechen. Der Teil der Zeile, der mit dem n. erfassten Untermuster übereinstimmt, wird dem n. Feld für diese Zeile zugewiesen.

So fügen Sie einen Decoder für reguläre Ausdrücke zu einer Textdatei-Decoder-Gruppe hinzu

  1. Öffnen Sie die Datei Log Processing Dataset Include, wie unter Bearbeiten vorhandener Datensatzaufnahme-Dateien beschrieben, und fügen Sie eine Textdatei-Decoder-Gruppe hinzu. Siehe Tabelleneintrag Decoder Groups.

  2. Klicken Sie mit der rechten Maustaste unter der neu erstellten Decoder-Gruppe auf Add new > Regular Expression und klicken Sie dann auf Decoders.

  3. Geben Sie die folgenden Informationen an:

    • Felder: Liste der Felder in der Protokolldatei. Wenn eines der hier definierten Felder an die Umwandlungsphase der Datensatzerstellung übergeben werden soll, müssen diese Felder im Parameter Felder einer der Log Processing Dataset Include -Dateien für den Datensatz aufgelistet werden. Benutzerdefinierte Feldnamen müssen mit "x-"beginnen.

    • Name: Optionale Kennung für den Decoder.

    • Regulärer Ausdruck: Wird verwendet, um die gewünschten Felder aus jeder Zeile in der Datei zu extrahieren.

  4. Wiederholen Sie die Schritte 4 und 5 für alle anderen Decoder, die Sie zur Gruppe hinzufügen möchten.

  5. Um die Datei Log Processing Dataset Include zu speichern, klicken Sie mit der rechten Maustaste auf (modified) oben im Fenster und klicken Sie auf Save.

  6. Damit die lokal vorgenommenen Änderungen wirksam werden, klicken Sie in der Spalte Profile Manager mit der rechten Maustaste auf das Häkchen für die Datei in der Spalte User. Klicken Sie auf Save to > <profile name, wobei der Profilname der Name des Datensatzprofils oder das geerbte Profil ist, zu dem die Datensatzaufnahme-Datei gehört.

Speichern Sie die geänderte Konfigurationsdatei nicht in einem der von Adobe bereitgestellten internen Profile, da Ihre Änderungen bei der Installation von Updates für diese Profile überschrieben werden.

HINWEIS

Eine Protokolldatei kann mehrere Decoder für reguläre Ausdrücke enthalten. Die Reihenfolge, in der Sie die Decoder definieren, ist wichtig: Der erste Decoder, der einer Zeile in der Protokolldatei entspricht, ist derjenige, der zum Dekodieren dieser Zeile verwendet wird.

Dieses Beispiel zeigt die Verwendung eines Decoders für reguläre Ausdrücke, um Datenfelder aus einer tabulatorgetrennten Textdatei zu extrahieren. Sie können dasselbe Ergebnis erzielen, indem Sie einen durch Trennzeichen getrennten Decoder mit einem Tabulatortrennzeichen definieren.

Weitere Informationen zu Decodern für reguläre Ausdrücke, einschließlich Terminologie und Syntax, finden Sie unter Reguläre Ausdrücke.

Trennzeichen

Ein mit Trennzeichen versehener Decoder dekodiert eine Protokolldatei, deren Felder durch ein einzelnes Zeichen getrennt sind. Die Anzahl der Felder muss der Anzahl der Spalten in der durch Trennzeichen getrennten Datei entsprechen. Es müssen jedoch nicht alle Felder benannt werden. Wenn ein Feld leer gelassen wird, ist die Spalte weiterhin in der Protokolldatei erforderlich, aber der Decoder ignoriert sie.

So fügen Sie einen durch Trennzeichen getrennten Decoder zu einer Textdatei-Decoder-Gruppe hinzu

  1. Öffnen Sie die Datei Log Processing Dataset Include, wie unter Bearbeiten vorhandener Datensatzaufnahme-Dateien beschrieben, und fügen Sie eine Textdatei-Decoder-Gruppe hinzu. Siehe Tabelleneintrag Decoder Groups.

  2. Klicken Sie mit der rechten Maustaste unter der neu erstellten Decoder-Gruppe auf Add new > Delimited und klicken Sie dann auf Decoders.

  3. Geben Sie die folgenden Informationen an:

    • Felder: Liste der Felder in der Protokolldatei. Wenn eines der hier definierten Felder an die Umwandlungsphase der Datensatzerstellung übergeben werden soll, müssen diese Felder im Parameter Felder einer der Log Processing Dataset Include -Dateien für den Datensatz aufgelistet werden. Benutzerdefinierte Feldnamen müssen mit "x-"beginnen.

    • Trennzeichen: Zeichen, das zum Trennen von Feldern in der Ausgabedatei verwendet wird.

  4. Wiederholen Sie die Schritte 4 und 5 für alle anderen Decoder, die Sie zur Gruppe hinzufügen möchten.

  5. Um die Datei Log Processing Dataset Include zu speichern, klicken Sie mit der rechten Maustaste auf (modified) oben im Fenster und klicken Sie auf Save.

  6. Damit die lokal vorgenommenen Änderungen wirksam werden, klicken Sie in der Spalte Profile Manager mit der rechten Maustaste auf das Häkchen für die Datei in der Spalte User und klicken Sie dann auf Save to > <profile name, wobei der Profilname der Name des Datensatzprofils oder das geerbte Profil ist, zu dem die Datensatzaufnahme gehört.

HINWEIS

Speichern Sie die geänderte Konfigurationsdatei nicht in einem der von Adobe bereitgestellten internen Profile, da Ihre Änderungen bei der Installation von Updates für diese Profile überschrieben werden.

Dieses Beispiel zeigt die Verwendung eines durch Trennzeichen getrennten Decoders zum Extrahieren von Datenfeldern aus einer kommagetrennten Textdatei mit Daten zu Filmen.

Auf dieser Seite