Textdatei-Decoder-Gruppen

WICHTIG

Mehr über die Data Workbench Mitteilung zum Ende der Nutzungsdauer.

Die Verarbeitung von Protokolldateien als Protokollquellen erfordert die Definition eines Decoders in der Datensatzaufnahme-Datei zur Protokollverarbeitung, um Datenfelder aus den Protokolleinträgen zu extrahieren.

Die Definition von Textdatei-Decoder-Gruppen für Protokolldateiquellen erfordert Kenntnisse über die Struktur und den Inhalt der Protokolldatei, die zu extrahierenden Daten und die Felder, in denen diese Daten gespeichert werden. Dieser Abschnitt enthält grundlegende Beschreibungen der Parameter, die Sie für Decoder angeben können. Die Art und Weise, in der Sie Decoder verwenden, hängt jedoch von der Protokolldatei ab, die Ihre Quelldaten enthält.

Informationen zu den Formatanforderungen für Protokollquellen für Protokolldateien finden Sie unter Protokolldateien. Wenden Sie sich zur Unterstützung bei der Definition von Textdatei-Decodern an die Adobe.

Eine Textdatei-Decoder-Gruppe kann Folgendes umfassen:

Decoder für reguläre Ausdrücke

Ein Decoder für reguläre Ausdrücke identifiziert komplexe Zeichenfolgenmuster in den Protokolleinträgen in einer Protokolldatei und extrahiert diese Muster als Datenfelder. Die Anzahl der Felder muss für jeden Decoder der Anzahl der erfassten Untermuster im regulären Ausdruck entsprechen. Der Teil der Zeile, der mit dem n. erfassten Untermuster übereinstimmt, wird dem n. Feld für diese Zeile zugewiesen.

So fügen Sie einen Decoder für reguläre Ausdrücke zu einer Textdatei-Decoder-Gruppe hinzu

  1. Öffnen Sie die Log Processing Dataset Include Datei wie unter Bearbeiten vorhandener Datensatzaufnahme-Dateien und fügen Sie eine Textdatei-Decoder-Gruppe hinzu. Siehe Tabelleneintrag Decoder-Gruppen.

  2. Rechtsklick Decoders Klicken Sie unter der neu erstellten Decoder-Gruppe auf Add new > Regular Expression.

  3. Geben Sie die folgenden Informationen an:

    • Felder: Liste der Felder in der Protokolldatei. Wenn eines der hier definierten Felder an die Umwandlungsphase der Datensatzerstellung übergeben werden soll, müssen diese Felder im Parameter Felder eines der Log Processing Dataset Include -Dateien für den Datensatz. Benutzerdefinierte Feldnamen müssen mit "x-"beginnen.

    • Name: Optionale Kennung für den Decoder.

    • Regulärer Ausdruck: Wird verwendet, um die gewünschten Felder aus jeder Zeile in der Datei zu extrahieren.

  4. Wiederholen Sie die Schritte 4 und 5 für alle anderen Decoder, die Sie zur Gruppe hinzufügen möchten.

  5. So speichern Sie die Log Processing Dataset Include Datei, Rechtsklick (modified) Klicken Sie oben im Fenster auf Save.

  6. Damit die lokal vorgenommenen Änderungen wirksam werden, finden Sie im Profile Managerklicken Sie mit der rechten Maustaste auf das Häkchen für die Datei im User Spalte. Klicken Save to > <profile name>, wobei der Profilname der Name des Datensatzprofils oder das geerbte Profil ist, zu dem die Datensatzaufnahme-Datei gehört.

Speichern Sie die geänderte Konfigurationsdatei nicht in einem der von Adobe bereitgestellten internen Profile, da Ihre Änderungen bei der Installation von Updates für diese Profile überschrieben werden.

HINWEIS

Eine Protokolldatei kann mehrere Decoder für reguläre Ausdrücke enthalten. Die Reihenfolge, in der Sie die Decoder definieren, ist wichtig: Der erste Decoder, der einer Zeile in der Protokolldatei entspricht, ist derjenige, der zum Dekodieren dieser Zeile verwendet wird.

Dieses Beispiel zeigt die Verwendung eines Decoders für reguläre Ausdrücke, um Datenfelder aus einer tabulatorgetrennten Textdatei zu extrahieren. Sie können dasselbe Ergebnis erzielen, indem Sie einen durch Trennzeichen getrennten Decoder mit einem Tabulatortrennzeichen definieren.

Weitere Informationen zu Decodern für reguläre Ausdrücke, einschließlich Terminologie und Syntax, finden Sie unter Reguläre Ausdrücke.

Getrennte Decoders

Ein mit Trennzeichen versehener Decoder dekodiert eine Protokolldatei, deren Felder durch ein einzelnes Zeichen getrennt sind. Die Anzahl der Felder muss der Anzahl der Spalten in der durch Trennzeichen getrennten Datei entsprechen. Es müssen jedoch nicht alle Felder benannt werden. Wenn ein Feld leer gelassen wird, ist die Spalte weiterhin in der Protokolldatei erforderlich, aber der Decoder ignoriert sie.

So fügen Sie einen durch Trennzeichen getrennten Decoder zu einer Textdatei-Decoder-Gruppe hinzu

  1. Öffnen Sie die Log Processing Dataset Include Datei wie unter Bearbeiten vorhandener Datensatzaufnahme-Dateien und fügen Sie eine Textdatei-Decoder-Gruppe hinzu. Siehe Tabelleneintrag Decoder-Gruppen.

  2. Rechtsklick Decoders Klicken Sie unter der neu erstellten Decoder-Gruppe auf Add new > Delimited.

  3. Geben Sie die folgenden Informationen an:

    • Felder: Liste der Felder in der Protokolldatei. Wenn eines der hier definierten Felder an die Umwandlungsphase der Datensatzerstellung übergeben werden soll, müssen diese Felder im Parameter Felder eines der Log Processing Dataset Include -Dateien für den Datensatz. Benutzerdefinierte Feldnamen müssen mit "x-"beginnen.

    • Trennzeichen: Zeichen, das zum Trennen von Feldern in der Ausgabedatei verwendet wird.

  4. Wiederholen Sie die Schritte 4 und 5 für alle anderen Decoder, die Sie zur Gruppe hinzufügen möchten.

  5. So speichern Sie die Log Processing Dataset Include Datei, Rechtsklick (modified) Klicken Sie oben im Fenster auf Save.

  6. Damit die lokal vorgenommenen Änderungen wirksam werden, finden Sie im Profile Managerklicken Sie mit der rechten Maustaste auf das Häkchen für die Datei im User und klicken Sie auf Save to > <profile name>, wobei der Profilname der Name des Datensatzprofils oder das geerbte Profil ist, zu dem die Datensatzaufnahme-Datei gehört.

HINWEIS

Speichern Sie die geänderte Konfigurationsdatei nicht in einem der von Adobe bereitgestellten internen Profile, da Ihre Änderungen bei der Installation von Updates für diese Profile überschrieben werden.

Dieses Beispiel zeigt die Verwendung eines durch Trennzeichen getrennten Decoders zum Extrahieren von Datenfeldern aus einer kommagetrennten Textdatei mit Daten zu Filmen.

Auf dieser Seite