Definieren von Lookup-Umwandlungen

Informationen zu den Transformationen, mit denen Sie Suchdaten in den Datensatz integrieren können.

Beachten Sie, dass nicht alle Typen in beiden Phasen des Datensatzerstellungsprozesses verwendet werden können.

Kategorisieren

Die Umwandlung von Categorize verwendet eine zweispaltige Nachschlagetabelle, die aus Musterzeichenfolgen-/Wertpaaren besteht. Während dieser Transformation liest der Data Workbench-Server jeden Ereignisdatensatz abwechselnd und vergleicht den Inhalt eines angegebenen Felds im Datensatz mit jeder der in der ersten Spalte der Suchtabelle aufgelisteten Musterzeichenfolgen. Wenn das angegebene Feld mit einer der Musterzeichenfolgen übereinstimmt, schreibt der Data Workbench-Server den Wert (in der zweiten Spalte zu finden), der mit dieser Musterzeichenfolge verknüpft ist, in ein bestimmtes Ausgabefeld im Datensatz.

Die Zeichenfolgen in der ersten Spalte der Suchtabelle können optional mit dem Zeichen ^ beginnen und/oder im Zeichen $ enden, um die Übereinstimmung am Anfang und/oder Ende zu erzwingen. Diese Umwandlung akzeptiert keine regulären Ausdrücke zum Definieren von Übereinstimmungsbedingungen in der ersten Spalte. Wenn der Eingabewert ein Vektor von Zeichenfolgen ist, wird jede Zeichenfolge durch die Transformation ausgeführt und die Ergebnisse werden an einen Ausgabezeichenfolgenvektor angehängt.

Eine Categorize-Umwandlung ist im Allgemeinen einfacher und schneller als die Verwendung einer Regular Expression-Umwandlung, um dasselbe zu erreichen.

HINWEIS

Beim in Categorize verwendeten Teilzeichenfolgentest wird zwischen Groß- und Kleinschreibung unterschieden, sofern nicht anders mit dem Parameter Case Sensitive angegeben.

Parameter Beschreibung Standard
Name Deskriptiver Name der Transformation. Hier können Sie einen beliebigen Namen eingeben.
Groß-/Kleinschreibung Wahr oder falsch. Gibt an, ob beim Teilzeichenfolgentest die Groß-/Kleinschreibung beachtet wird. true (wahr)
Kommentare Optional. Anmerkungen zur Transformation.
Bedingung Die Bedingungen, unter denen diese Umwandlung angewendet wird.
Standard Der Standardwert, der verwendet wird, wenn der Bedingungstest erfolgreich ist und kein Eintrag in der Kategorisierungsdatei mit der Eingabe übereinstimmt oder das Eingabefeld im angegebenen Protokolleintrag nicht definiert ist.
Trennzeichen

Zeichenfolge, die verwendet wird, um die Spalten in der Lookup-Datei zu trennen. Muss ein einzelnes Zeichen in der Länge sein.

Wenn Sie die Strg-Taste gedrückt halten und mit der rechten Maustaste im Trennzeichen-Parameter klicken, wird das Menü Einfügen angezeigt. Dieses Menü enthält eine Liste von Sonderzeichen, die häufig als Trennzeichen verwendet werden.

Mehrfachwerte Wahr oder falsch. Wenn der Wert "true"lautet und mehrere Zeilen in der Datei mit der Eingabe übereinstimmen, führt jede Übereinstimmung dazu, dass ein Wert an den Ausgabevektor von Zeichenfolgen angehängt wird. Wenn "false", wird nur die erste übereinstimmende Zeile in der Datei in der Ausgabe verwendet. Wenn die Eingabe ein Vektor ist, ist die Ausgabe in letzterem Fall auch ein Vektor der äquivalenten Länge. Wenn es sich bei der Eingabe um eine einfache Zeichenfolge handelt, ist die Ausgabe auch eine einfache Zeichenfolge. false (falsch)
Datei Pfad und Dateiname der Kategorisierungsdatei. Relative Pfade beziehen sich auf den Installationsordner für den Data Workbench-Server. Diese Datei befindet sich normalerweise im Ordner Suchen im Installationsordner des Data Workbench-Servers.
Eingabe Die Kategorisierungsdatei stimmt die zugehörigen Unterzeichenfolgen mit dem Wert in diesem Feld überein, um die übereinstimmende Zeile in der Datei zu identifizieren.
Ausgabe Der Name des mit dem Ergebnis verknüpften Felds.

Überlegungen zur Kategorisierung

  • Änderungen an Lookup-Dateien in Categorize-Transformationen, die in der Transformation.cfg-Datei oder in einer Transformation Dataset Include-Datei definiert sind, erfordern eine Neuumwandlung des Datensatzes. Suchdateien für Categorize-Transformationen, die in der Log Processing.cfg-Datei oder in einer Log Processing Dataset Include-Datei definiert sind, unterliegen dieser Einschränkung nicht. Weitere Informationen zur erneuten Verarbeitung Ihrer Daten finden Sie unter Wiederaufbereitung und erneute Umwandlung.

  • Categorize in der Log Processing.cfg Datei oder in einer Log Processing Dataset Include Datei definierte Umwandlungen laden ihre Lookup-Dateien neu, sobald sich die Lookup-Dateien ändern. Änderungen werden nicht rückwirkend angewendet, sondern gelten für alle Protokolldaten, die nach der Änderung gelesen werden.

In diesem Beispiel wird die Verwendung der Umwandlung Categorize zur Integration von Suchdaten in Ereignisdaten veranschaulicht, die aus dem Website-Traffic erfasst wurden. Angenommen, eine bestimmte Website enthält Geschäftsbereiche, und es ist erforderlich, dass sie sich ansehen und Vergleiche auf der Grundlage von Traffic-Fluss und -Wert vornehmen kann, der von den verschiedenen Abschnitten generiert wurde. Sie können eine Lookup-Datei erstellen, in der die Unterzeichenfolgen aufgelistet werden, die zur Identifizierung dieser verschiedenen Abschnitte verwendet werden.

Die Lookup-Datei Lookups\custommap.txt enthält die folgende Tabelle:

/products/ Produkte
^/Sport/ Sport
^/News/ Nachrichten

Diese Kategorisierungsdatei ordnet alles, das die Zeichenfolge "/products/"enthält, dem Wert "Products"zu, alles, was mit "/sports/"beginnt, dem Wert "Sports"und alles, was mit "/news/"beginnt, dem Wert "News" zu. Die folgende Kategorisierungstransformation verwendet den Wert im Feld "cs-uri-stamm"als Zeichenfolge, in der wir nach einer übereinstimmenden Teilzeichenfolge suchen. Das Ergebnis der Transformation wird in das Feld x-customMap eingefügt.

Wenn der Parameter "Multiple Values"auf "false"gesetzt ist, würde das Beispiel die folgenden Werte für "x-customMap"mit den aufgelisteten Werten für cs-uri-Stamm generieren.

cs-uri-stem x-custommap
/sports/news/today.php Sport
/sports/products/buy.php Produkte
/news/headlines.php Nachrichten
/news/products/subscribe.php Produkte

Die Ausgabe basiert auf der Reihenfolge der Unterzeichenfolgen in der Lookup-Datei. Beispielsweise gibt der cs-uri-Stamm /sports/products/buy.php "Products"zurück. Obwohl der URI-Stamm mit "/sports/"beginnt, wird die Zeichenfolge "/products/"vor "/sports/"in der Lookup-Datei aufgeführt. Wenn der Parameter "Multiple Values"auf "true"gesetzt wäre, gäbe es einen zusätzlichen Wert für "x-customMap", da das letzte Beispiel mit zwei Zeilen in der Suchtabelle übereinstimmen würde: Produkte und Nachrichten.

FlatFileLookup

Die Umwandlung von FlatFileLookup verwendet eine Nachschlagetabelle, die aus einer beliebigen Anzahl von Spalten und Zeilen besteht (obwohl Sie sich daran erinnern, dass sie sich im Speicher befindet). Während dieser Umwandlung liest der Data Workbench-Server jeden Ereignisdatensatz einzeln und vergleicht den Inhalt eines bestimmten Felds im Datensatz mit jedem der Werte in einer bestimmten Spalte der Suchtabelle. Wenn eine Übereinstimmung vorliegt, schreibt der Data Workbench-Server einen oder mehrere Werte aus der entsprechenden Zeile in der Suchtabelle in ein oder mehrere ausgewiesene Ausgabefelder im Ereignisdatensatz.

Die bei dieser Umwandlung verwendete Nachschlagetabelle wird aus einer flachen Datei gefüllt, deren Speicherort Sie bei der Definition der Umwandlung angeben.

Parameter Beschreibung Standard
Name Deskriptiver Name der Transformation. Hier können Sie einen beliebigen Namen eingeben.
Kommentare Optional. Anmerkungen zur Transformation.
Bedingung Die Bedingungen, unter denen diese Umwandlung angewendet wird.
Standard Der Standardwert, der verwendet wird, wenn die Bedingung erfüllt ist und kein Eintrag in der Lookup-Datei mit der Eingabe übereinstimmt.
Trennzeichen

Zeichenfolge, die verwendet wird, um die Spalten in der Lookup-Datei zu trennen. Muss ein einzelnes Zeichen in der Länge sein.

Wenn Sie die Strg-Taste gedrückt halten und mit der rechten Maustaste im Trennzeichen-Parameter klicken, wird das Menü Einfügen angezeigt. Dieses Menü enthält eine Liste von Sonderzeichen, die häufig als Trennzeichen verwendet werden.

Datei Pfad und Dateiname der Lookup-Datei. Relative Pfade beziehen sich auf den Installationsordner für den Data Workbench-Server. Diese Datei befindet sich normalerweise im Ordner "Suchen"im Installationsordner von Data Workbench Server.
Kopfzeile Wahr oder falsch. Gibt an, dass die erste Zeile in der Tabelle eine Kopfzeile ist, die bei der Verarbeitung ignoriert werden soll.
Eingabe Spalte Der Name der Spalte, die für die Zuordnung der Eingabe zu der/den Zeile(n) in der Datei verwendet wird. Wenn die Kopfzeile "true"ist, kann dies der Name einer Spalte in der Lookup-Datei sein. Andernfalls muss dies die nullbasierte Spaltennummer sein, mit der abgeglichen werden soll. Feld Name: der Name des Felds, das zum Suchen der Zeile in der Lookup-Datei verwendet wird.
Mehrfachwerte

Wahr oder falsch. Bestimmt, ob ein einzelner Wert (eine übereinstimmende Zeile) oder mehrere Werte zurückgegeben werden sollen (einer für jede übereinstimmende Zeile).

Hinweis: Wenn Multiple Values auf "false"gesetzt ist, müssen Sie sicherstellen, dass nicht mehrere Übereinstimmungen vorliegen. Wenn mehrere Übereinstimmungen auftreten, gibt es keine Garantie, welche Übereinstimmung zurückgegeben wird.

Ausgaben

Ein Vektor von Spaltenobjekten (Ergebnisse), in dem jedes Objekt durch Spalten- und Feldnamen definiert wird.

Spalte Die Spalte, aus der der Ausgabewert abgerufen wird. Wenn Kopfzeile "true"ist, kann dies der Name einer Spalte in der Lookup-Datei sein. Andernfalls muss dies die nullbasierte Spaltennummer sein, mit der abgeglichen werden soll.

Feld Name des Felds, das zum Erfassen der Ausgabe verwendet wird. Beachten Sie, dass dies ein Vektor von Ergebnissen sein kann, eine für jede Zeile, die identifiziert wird, wenn der Parameter "Multiple Values"wahr ist.

Überlegungen zuFlatFileLookup

  • Beim Abgleichen des Eingabefelds mit der Lookup-Datei wird immer zwischen Groß- und Kleinschreibung unterschieden.

  • Änderungen an Lookup-Dateien in FlatFileLookup -Transformationen, die in der Transformation.cfg -Datei oder in Transformation Dataset Include -Dateien definiert sind, erfordern eine Neuumwandlung des Datensatzes. Suchdateien für FlatFileLookup-Transformationen, die in der Log Processing.cfg-Datei oder in Log Processing Dataset Include-Dateien definiert sind, unterliegen dieser Einschränkung nicht. Weitere Informationen zur erneuten Verarbeitung Ihrer Daten finden Sie unter Wiederaufbereitung und erneute Umwandlung.

  • FlatFileLookup Transformationen in der Log Processing.cfg Datei oder in Log Processing Dataset Include Dateien laden ihre Lookup-Dateien neu, sobald sich die Lookup-Dateien ändern. Änderungen werden nicht rückwirkend angewendet, sondern gelten für alle Protokolldaten, die nach der Änderung gelesen werden.

In diesem Beispiel wird die Verwendung der Umwandlung FlatFileLookup zur Integration von Suchdaten in Ereignisdaten veranschaulicht, die aus dem Website-Traffic erfasst wurden. Angenommen, Sie möchten Website-Partner isolieren, die den Traffic an die Website weiterleiten, und ihre Partner-IDs in benutzerfreundlichere Namen umwandeln. Anschließend können Sie die benutzerfreundlichen Namen verwenden, um erweiterte Dimensionen und Visualisierungen zu erstellen, die der Geschäftsbeziehung besser zugeordnet sind als die Site-zu-Site-Beziehung, die für das Routing von Traffic verwendet wird.

Die Beispielumwandlung durchsucht das Feld cs(referrer-query) nach dem PartnerID-Namens-Wert-Paar. Wenn sich dieses Feld befindet, wird die Lookup-Datei Lookups\partners.txt verwendet, um den PartnerID-Wert mit den Werten in der Spalte Partner der Tabelle zu vergleichen. Wenn sich eine Zeile befindet, erhält das Ausgabefeld x-partner-name den Namen aus der Spalte PrintName der identifizierten Zeile.

Wenn die Suchtabelle die folgenden Informationen enthält:

ID Partner Gestartet PrintName
1 P154 21.08.1999 Yahoo
2 P232 10. Juli 2000 Microsoft
3 P945 12. Januar 2001 Amazon

Die folgenden Beispiele würden sich wie folgt transformieren:

  • Wenn cs(referrer)(PartnerID) P232 zurückgegeben hat, erhält das Feld x-partner-name den Wert "Microsoft".
  • Wenn cs(referrer)(PartnerID) P100 zurückgegeben hat, erhält das Feld x-partner-name den Wert "Kein Partner".
  • Wenn cs(referrer)(PartnerID) nichts zurückgegeben hat, erhält das Feld x-partner-name den Wert "Kein Partner", wie im Parameter "Standard"angegeben.

ODBCLookup

Die Umwandlung ODBCLookup funktioniert wie eine Umwandlung von FlatFileLookup. Der einzige Unterschied besteht darin, dass die bei dieser Umwandlung verwendete Suchtabelle aus einer ODBC-Datenbank und nicht aus einer reduzierten Datei gefüllt wird.

HINWEIS

ODBCLookup Transformationen können nur während der Umwandlungsphase des Datensatzerstellungsprozesses ausgeführt werden. Wenn möglich, empfiehlt Adobe, die Umwandlung FlatFileLookup anstelle der Umwandlung ODBCLookup zu verwenden. FlatFileLookup Transformationen sind von Natur aus zuverlässiger, da sie nicht von der Verfügbarkeit eines externen Systems abhängen. Außerdem besteht ein geringeres Risiko, dass die Suchtabelle geändert wird, wenn sie sich in einer flachen Datei befindet, die Sie lokal steuern.

Parameter Beschreibung Standard
Name Deskriptiver Name der Transformation. Hier können Sie einen beliebigen Namen eingeben.
Kommentare Optional. Anmerkungen zur Transformation.
Bedingung Die Bedingungen, unter denen diese Umwandlung angewendet wird.
Datenquellenname Ein DSN, das von einem Administrator des Data Workbench-Servercomputers bereitgestellt wird, auf dem der Datensatz verarbeitet wird, und sich auf die Datenbank bezieht, aus der Daten geladen werden sollen.
Datenbankkennwort Das Kennwort für die Verbindung mit der Datenbank. Wenn im Data Source Administrator ein Kennwort für den DSN konfiguriert wurde, kann dies leer gelassen werden. Jedes hier angegebene Kennwort setzt das für den DSN konfigurierte Kennwort im Datenquellenadministrator außer Kraft.
Benutzer-ID der Datenbank Die Benutzer-ID, die beim Herstellen einer Verbindung zur Datenbank verwendet wird. Wenn im Data Source Administrator eine Benutzer-ID für das DSN konfiguriert wurde, kann dies leer gelassen werden. Jede hier bereitgestellte Benutzer-ID setzt die Benutzer-ID außer Kraft, die für den DSN in Data Source Administrator konfiguriert ist.
Standard Der Standardwert, der verwendet wird, wenn die Bedingung erfüllt ist und kein Eintrag in der Lookup-Datei mit der Eingabe übereinstimmt.
Eingabespalte Spalte Name: Spaltenname oder SQL-Ausdruck für die Daten, die mit der Eingabe abgeglichen werden. Feld Der Name des Felds, das die zu suchenden Daten enthält.
Mehrfachwerte

Wahr oder falsch. Bestimmt, ob ein einzelner Wert (eine übereinstimmende Zeile) oder mehrere Werte zurückgegeben werden sollen (einer für jede übereinstimmende Zeile).

Hinweis: Wenn Multiple Values auf "false"gesetzt ist, müssen Sie sicherstellen, dass nicht mehrere Übereinstimmungen vorliegen. Wenn mehrere Übereinstimmungen auftreten, gibt es keine Garantie, welche Übereinstimmung zurückgegeben wird.

Ausgabespalten

Ein Vektor von Spaltenobjekten (Ergebnissen), wobei jedes Objekt durch Spalten- und Feldnamen definiert wird.

Spalte Name: der Name oder SQL-Ausdruck für die Spalte, aus der der Ausgabewert abgerufen wird. Feld Name des Felds, das zum Erfassen der Ausgabe verwendet wird.

Tabellenkennung Ein SQL-Ausdruck, der die Tabelle oder Ansicht benennt, aus der Daten geladen werden sollen. Eine typische Tabellenkennung ist vom Formular SCHEMA.TABLE.
  • Die Parameter für den Datenquellennamen, Database User ID, Database Password und die Tabellenkennung sind mit den Parametern der gleichen Namen identisch, die für ODBC-Datenquellen beschrieben werden. Siehe ODBC-Datenquellen.

  • Im Gegensatz zu ODBC-Datenquellen erfordern ODBCLookup-Transformationen keine zunehmende ID-Spalte. Siehe ODBC-Datenquellen. Dies liegt daran, dass sich der Inhalt der Suchtabelle während der aktiven Verwendung des Datensatzes in keiner Weise ändern darf. Änderungen in einer Suchtabelle oder Ansicht können erst erkannt werden, wenn eine Neuumwandlung erfolgt. Weitere Informationen zur erneuten Verarbeitung Ihrer Daten finden Sie unter Wiederaufbereitung und erneute Umwandlung.

Angenommen, Sie möchten veraltete DNS-Einträge in die aktualisierten Einträge konvertieren. Beide Datensätze werden in einer SQL-Datenbank gespeichert. Zu diesem Zweck würden Sie eine aus der Datenbank generierte Nachschlagetabelle referenzieren und die veralteten DNS-Einträge ersetzen.

Unsere Beispielumwandlung durchsucht die Protokolleinträge nach dem Feld s-dns und, falls vorhanden, wird die Suchtabelle VISUAL.LOOKUP verwendet, um den Eintrag s-dns mit den Einträgen in der Spalte OLDDNS der Tabelle zu vergleichen. Wenn sich eine Zeile in der Tabelle befindet, erhält das Ausgabefeld s-dns den aktualisierten DNS-Eintrag aus der Spalte NEWDNS der identifizierten Zeile.

Auf dieser Seite