Definieren von Lookup-Umwandlungen

Informationen zu den Transformationen, mit denen Sie Nachschlagedaten in den Datensatz integrieren können.

Beachten Sie, dass nicht alle Typen in beiden Phasen des Datensatzerstellungsprozesses verwendet werden können.

Kategorisieren

Die Categorize-Transformation verwendet eine zweispaltige Nachschlagetabelle, die aus Musterzeichenfolgen-/Wertpaaren besteht. Während dieser Transformation liest der Data Workbench-Server jeden Ereignis-Datensatz nacheinander und vergleicht den Inhalt eines angegebenen Felds im Datensatz mit jeder der in der ersten Spalte der Suchtabelle aufgeführten Musterzeichenfolgen. Wenn das angegebene Feld mit einer der Musterzeichenfolgen übereinstimmt, schreibt der Data Workbench-Server den Wert (in der zweiten Spalte zu finden), der mit dieser Musterzeichenfolge verknüpft ist, in ein angegebenes Ausgabefeld im Datensatz.

Die Zeichenfolgen in der ersten Spalte der Suchtabelle können optional mit dem Zeichen "^"und/oder mit dem Zeichen "$"Beginn werden, um die Übereinstimmung am Anfang und/oder am Ende zu erzwingen. Diese Transformation akzeptiert keine regulären Ausdruck zum Definieren von Übereinstimmungsbedingungen in der ersten Spalte. Wenn der Eingabewert ein Vektor von Zeichenfolgen ist, wird jede Zeichenfolge durch die Transformation ausgeführt und das Ergebnis/die Ergebnisse werden an einen Ausgabezeichenfolgen-Vektor angehängt.

Eine Categorize-Transformation ist im Allgemeinen einfacher und schneller als die Verwendung einer Regular Expression-Transformation, um dasselbe zu erreichen.

HINWEIS

Beim in Categorize verwendeten Teilzeichenfolgentest wird die Groß-/Kleinschreibung beachtet, sofern nicht anders mit dem Parameter Case Sensitive angegeben.

Parameter Beschreibung Standard
Name Beschreibender Name der Transformation. Sie können hier einen beliebigen Namen eingeben.
Groß-/Kleinschreibung Wahr oder falsch. Gibt an, ob beim Unterzeichenfolgentest die Groß-/Kleinschreibung beachtet wird. true (wahr)
Kommentare Optional. Anmerkungen zur Transformation.
Bedingung Die Bedingungen, unter denen diese Umwandlung angewendet wird.
Standard Der Standardwert, der verwendet wird, wenn der Bedingungstest erfolgreich verläuft und kein Eintrag in der Kategorisierungsdatei mit der Eingabe übereinstimmt oder das Eingabefeld im angegebenen Protokolleintrag nicht definiert ist.
Trennzeichen

String, der zum Trennen der Spalten in der Lookup-Datei verwendet wird. Muss ein einzelnes Zeichen lang sein.

Wenn Sie die Strg-Taste gedrückt halten und mit der rechten Maustaste in den Trennzeichner-Parameter klicken, wird das Menü Einfügen angezeigt. Dieses Menü enthält eine Liste von Sonderzeichen, die häufig als Trennzeichen verwendet werden.

Mehrfachwerte Wahr oder falsch. Wenn "true", werden mehrere Zeilen in der Datei mit der Eingabe übereinstimmen, wird bei jeder Übereinstimmung ein Wert an den Ausgabevektor der Zeichenfolgen angehängt. Bei "false"wird nur die erste übereinstimmende Zeile in der Datei in der Ausgabe verwendet. Im letzteren Fall, wenn die Eingabe ein Vektor ist, ist die Ausgabe auch ein Vektor der entsprechenden Länge. Wenn die Eingabe eine einfache Zeichenfolge ist, ist die Ausgabe auch eine einfache Zeichenfolge. false (falsch)
Datei Pfad und Dateiname der Kategorisierungsdatei. Relative Pfade beziehen sich auf den Installationsordner für den Data Workbench-Server. Diese Datei befindet sich normalerweise im Ordner "Suchen"im Installationsordner des Data Workbench-Servers.
Eingabe Die Kategorisierungsdatei stimmt mit ihren Unterzeichenfolgen mit dem Wert in diesem Feld überein, um die übereinstimmende Zeile in der Datei zu identifizieren.
Ausgabe Der Name des mit dem Ergebnis verknüpften Felds.

Überlegungen zur Kategorisierung

  • Änderungen an Lookup-Dateien in Categorize-Konvertierungen, die in der Transformation.cfg-Datei oder in einer Transformation Dataset Include-Datei definiert sind, erfordern eine Konvertierung des Datensatzes. Suchdateien für Categorize-Konvertierungen, die in der Log Processing.cfg-Datei oder einer Log Processing Dataset Include-Datei definiert sind, unterliegen nicht dieser Einschränkung. Weitere Informationen zur erneuten Verarbeitung Ihrer Daten finden Sie unter Wiederaufbereitung und Verarbeitung.

  • Categorize Konvertierungen, die in der Log Processing.cfg Datei oder in einer Log Processing Dataset Include Datei definiert sind, laden ihre Lookup-Dateien erneut, sobald sich die Lookup-Dateien ändern. Änderungen werden nicht rückwirkend angewendet, sondern gelten für alle Protokolldaten, die nach der Änderung gelesen werden.

In diesem Beispiel wird die Verwendung der Categorize-Transformation zur Integration von Nachschlagedaten mit Ereignis-Daten veranschaulicht, die aus dem Website-Traffic erfasst wurden. Nehmen wir an, eine bestimmte Website hat Geschäftsbereiche, und es ist erforderlich, dass Sie Vergleiche auf Grundlage des Traffic-Flusses und des durch die verschiedenen Abschnitte generierten Wertes anstellen und durchführen können. Sie können eine Lookup-Datei erstellen, in der die Unterzeichenfolgen zur Identifizierung dieser verschiedenen Bereiche Liste werden.

Die Lookup-Datei Lookups\custommap.txt enthält die folgende Tabelle:

/products/ Produkte
^/Sport/ Sport
^/News/ Nachrichten

Diese Kategorisierungsdatei ordnet alles, was die Zeichenfolge "/products/"enthält, dem Wert "Produkte"zu, alles was mit "/sports/"beginnt, dem Wert "Sports"und alles, was mit "/news/"beginnt, dem Wert "News"zu. Die folgende Kategorisierungstransformation verwendet den Wert im Feld "cs-uri-stamm"als Zeichenfolge, in der wir nach einer übereinstimmenden Teilzeichenfolge suchen. Das Ergebnis der Transformation wird in das Feld x-customMap platziert.

Unter der Annahme, dass der Parameter "Mehrere Werte"auf "false"gesetzt ist, würde das Beispiel die folgenden Werte für x-customMap bei den aufgeführten Werten für cs-uri-stamm erzeugen.

cs-uri-stem x-custommap
/sports/news/today.php Sport
/sports/products/buy.php Produkte
/news/headlines.php Nachrichten
/news/products/subscribe.php Produkte

Die Ausgabe basiert auf der Reihenfolge der Unterzeichenfolgen in der Abfragedatei. Beispiel: Der cs-uri-stamm /sports/products/buy.php gibt "Produkte"zurück. Obwohl der URI-Stamm-Beginn mit "/sports/", wird die Zeichenfolge "/products/"vor "/sports/"in der Lookup-Datei aufgeführt. Wenn der Parameter "Mehrere Werte"auf "true"gesetzt wurde, gibt es einen zusätzlichen Wert für x-customMap, da das letzte Beispiel zwei Zeilen in der Suchtabelle entsprechen würde: Produkte und Nachrichten.

FlatFileLookup

Die FlatFileLookup-Transformation verwendet eine Suchtabelle, die aus einer beliebigen Anzahl von Spalten und Zeilen besteht (auch wenn Sie sich daran erinnern, dass sie sich im Speicher befindet). Während dieser Art der Transformation liest der Data Workbench-Server jeden Ereignis-Datensatz nacheinander und vergleicht den Inhalt eines angegebenen Felds im Datensatz mit jedem der Werte in einer angegebenen Spalte der Suchtabelle. Wenn eine Übereinstimmung vorliegt, schreibt der Data Workbench-Server einen oder mehrere Werte aus der übereinstimmenden Zeile in der Suchtabelle in eines oder mehrere festgelegte Ausgabefelder im Ereignis-Datensatz.

Die bei dieser Transformation verwendete Nachschlagetabelle wird aus einer reduzierten Datei gefüllt, deren Speicherort Sie beim Definieren der Transformation angeben.

Parameter Beschreibung Standard
Name Beschreibender Name der Transformation. Sie können hier einen beliebigen Namen eingeben.
Kommentare Optional. Anmerkungen zur Transformation.
Bedingung Die Bedingungen, unter denen diese Umwandlung angewendet wird.
Standard Der Standardwert, der verwendet wird, wenn die Bedingung erfüllt ist und kein Eintrag in der Abfragedatei mit der Eingabe übereinstimmt.
Trennzeichen

String, der zum Trennen der Spalten in der Lookup-Datei verwendet wird. Muss ein einzelnes Zeichen lang sein.

Wenn Sie die Strg-Taste gedrückt halten und mit der rechten Maustaste in den Trennzeichner-Parameter klicken, wird das Menü Einfügen angezeigt. Dieses Menü enthält eine Liste von Sonderzeichen, die häufig als Trennzeichen verwendet werden.

Datei Pfad und Dateiname der Lookup-Datei. Relative Pfade beziehen sich auf den Installationsordner für den Data Workbench-Server. Diese Datei befindet sich normalerweise im Ordner "Suchen"im Installationsordner von Data Workbench Server.
Kopfzeile Wahr oder falsch. Gibt an, dass die erste Zeile in der Tabelle eine Kopfzeile ist, die bei der Verarbeitung ignoriert werden soll.
Eingabe Spaltenname ist der Name der Spalte, die für die Zuordnung der Eingabe zu der (den) Zeile(n) in der Datei verwendet wird. Wenn "Kopfzeile"den Wert "true"hat, kann dies der Name einer Spalte in der Lookup-Datei sein. Andernfalls muss es sich um die auf null basierende Spaltennummer handeln, mit der abgeglichen werden soll. Feldnamen ist der Name des Felds, das zum Suchen der Zeile in der Abfragedatei verwendet wird.
Mehrfachwerte

Wahr oder falsch. Bestimmt, ob ein einzelner Wert (eine übereinstimmende Zeile) oder mehrere Werte zurückgegeben werden sollen (einer für jede übereinstimmende Zeile).

Hinweis: Wenn Mehrere Werte auf "false"gesetzt sind, müssen Sie sicherstellen, dass nicht mehrere Übereinstimmungen vorhanden sind. Wenn mehrere Übereinstimmungen auftreten, gibt es keine Garantie, welche Übereinstimmung zurückgegeben wird.

Ausgaben

Ein Vektor von Spaltenobjekten (Ergebnisse), in dem jedes Objekt durch Spalten- und Feldnamen definiert wird.

Spaltennamen ist die Spalte, aus der der Ausgabewert abgerufen wird. Wenn "Kopfzeile"true ist, kann dies der Name einer Spalte in der Lookup-Datei sein. Andernfalls muss es sich um die auf null basierende Spaltennummer handeln, mit der abgeglichen werden soll.

Feldnamen ist der Name des Felds, das zum Erfassen der Ausgabe verwendet wird. Beachten Sie, dass dies ein Vektor von Ergebnissen sein kann, einer für jede Zeile, die identifiziert wird, wenn der Parameter "Mehrere Werte"wahr ist.

Überlegungen zuFlatFileLookup

  • Beim Abgleichen des Eingabefelds mit der Nachschlagedatei wird immer zwischen Groß- und Kleinschreibung unterschieden.

  • Änderungen an Lookup-Dateien in FlatFileLookup-Konvertierungen, die in der Transformation.cfg- oder Transformation Dataset Include-Datei definiert sind, erfordern eine Konvertierung des Datensatzes. Suchdateien für FlatFileLookup-Konvertierungen, die in der Log Processing.cfg- oder Log Processing Dataset Include-Datei definiert sind, unterliegen nicht dieser Einschränkung. Weitere Informationen zur erneuten Verarbeitung Ihrer Daten finden Sie unter Wiederaufbereitung und Verarbeitung.

  • FlatFileLookup -Konvertierungen in der Log Processing.cfg Datei oder in den Log Processing Dataset Include Dateien laden ihre Lookup-Dateien neu, sobald sich die Lookup-Dateien ändern. Änderungen werden nicht rückwirkend angewendet, sondern gelten für alle Protokolldaten, die nach der Änderung gelesen werden.

In diesem Beispiel wird die Verwendung der FlatFileLookup-Transformation zur Integration von Nachschlagedaten mit Ereignis-Daten veranschaulicht, die aus dem Website-Traffic erfasst wurden. Angenommen, Sie möchten Website-Partner isolieren, die Routing-Traffic zur Website betreiben, und ihre Partner-IDs in benutzerfreundlichere Namen umwandeln. Anschließend können Sie die benutzerfreundlichen Namen verwenden, um erweiterte Dimensionen und Visualisierungen zu erstellen, die der Geschäftsbeziehung klarer zugeordnet sind als die Site-zu-Site-Beziehung, die für den Routing-Traffic verwendet wird.

Die Beispieltransformation durchsucht das Feld cs(Werber-Abfrage) nach dem PartnerID-Namens-Wert-Paar. Wenn Sie sich dort befinden, wird die Abfragedatei Lookups\partners.txt verwendet, um den PartnerID-Wert mit den Werten in der Tabellenspalte Partner zu vergleichen. Wenn sich eine Zeile befindet, erhält das Ausgabefeld x-partner-name den Namen aus der Spalte PrintName der angegebenen Zeile.

Wenn die Suchtabelle die folgenden Informationen enthält:

ID Partner Gestartet PrintName
1 P154 21.08.1999 Yahoo
2 P232 10. Juli 2000 Microsoft
3 P945 12. Januar 2001 Amazon

Die folgenden Beispiele würden sich wie folgt verändern:

  • Wenn cs(Werber)(PartnerID) P232 zurückgegeben hat, erhält das Feld x-partner-name den Wert "Microsoft".
  • Wenn cs(Werber)(PartnerID) P100 zurückgegeben hat, erhält das Feld x-partner-name den Wert "Kein Partner".
  • Wenn cs(Werber)(PartnerID) nichts zurückgegeben hat, erhält das Feld x-partner-name den Wert "Kein Partner", wie im Parameter Default angegeben.

ODBCLookup

Die ODBCLookup-Transformation funktioniert wie eine FlatFileLookup-Transformation. Der einzige Unterschied besteht darin, dass die bei dieser Transformation verwendete Nachschlagetabelle aus einer ODBC-Datenbank und nicht aus einer einfachen Datei gefüllt wird.

HINWEIS

ODBCLookup Transformationen können nur während der Umwandlungsphase des Dataset-Aufbaus ausgeführt werden. Wenn möglich, empfiehlt Adobe die Verwendung der Transformation FlatFileLookup anstelle der Transformation ODBCLookup. FlatFileLookup Transformationen sind von Natur aus zuverlässiger, da sie nicht von der Verfügbarkeit eines externen Systems abhängen. Außerdem besteht weniger Risiko, dass die Suchtabelle geändert wird, wenn sie sich in einer flachen Datei befindet, die Sie lokal steuern.

Parameter Beschreibung Standard
Name Beschreibender Name der Transformation. Sie können hier einen beliebigen Namen eingeben.
Kommentare Optional. Anmerkungen zur Transformation.
Bedingung Die Bedingungen, unter denen diese Umwandlung angewendet wird.
Datenquellenname Ein DSN, das von einem Administrator des Data Workbench-Servercomputers, auf dem der Datensatz verarbeitet wird, bereitgestellt wird und sich auf die Datenbank bezieht, aus der Daten geladen werden sollen.
Datenbankkennwort Das Kennwort, das beim Herstellen einer Verbindung zur Datenbank verwendet wird. Wenn im Ordner Data Source Administrator ein Kennwort für das DSN konfiguriert wurde, kann dies leer bleiben. Jedes hier bereitgestellte Kennwort setzt das für das DSN konfigurierte Kennwort in Datenquellen-Administrator außer Kraft.
Benutzer-ID der Datenbank Die beim Herstellen einer Verbindung zur Datenbank zu verwendende Benutzer-ID. Wenn im Ordner Data Source Administrator eine Benutzer-ID für das DSN konfiguriert wurde, kann dies leer bleiben. Jede hier bereitgestellte Benutzer-ID setzt die Benutzer-ID außer Kraft, die für das DSN im Ordner Data Source Administrator konfiguriert wurde.
Standard Der Standardwert, der verwendet wird, wenn die Bedingung erfüllt ist und kein Eintrag in der Abfragedatei mit der Eingabe übereinstimmt.
Eingabespalte Spaltenname ist der Spaltenname oder SQL-Ausdruck für die Daten, die mit der Eingabe abgeglichen werden. Feldnamen ist der Name des Felds, das die zu suchenden Daten enthält.
Mehrfachwerte

Wahr oder falsch. Bestimmt, ob ein einzelner Wert (eine übereinstimmende Zeile) oder mehrere Werte zurückgegeben werden sollen (einer für jede übereinstimmende Zeile).

Hinweis: Wenn Mehrere Werte auf "false"gesetzt sind, müssen Sie sicherstellen, dass nicht mehrere Übereinstimmungen vorhanden sind. Wenn mehrere Übereinstimmungen auftreten, gibt es keine Garantie, welche Übereinstimmung zurückgegeben wird.

Ausgabespalten

Ein Vektor von Spaltenobjekten (Ergebnisse), bei dem jedes Objekt durch Spalten- und Feldnamen definiert wird.

Spaltennamen ist der Name des SQL-Ausdrucks für die Spalte, aus der der Ausgabenwert abgerufen wird. Feldnamen ist der Name des Felds, das zum Erfassen der Ausgabe verwendet wird.

Tabellenkennung Ein SQL-Ausdruck, der die Tabelle oder Ansicht benennt, aus der Daten geladen werden sollen. Eine typische Tabellenkennung ist das form SCHEMA.TABLE.
  • Die Parameter "Datenquellenname", "Database User ID", "Database Password"und "Tabellenbezeichner"entsprechen den Parametern der gleichen Namen, die für ODBC-Datenquellen beschrieben werden. Siehe ODBC-Datenquellen.

  • Im Gegensatz zu ODBC-Datenquellen ist für ODBCLookup-Transformationen keine zunehmende ID-Spalte erforderlich. Siehe ODBC-Datenquellen. Das liegt daran, dass sich der Inhalt der Suchtabelle während der aktiven Ausführung des Datensatzes in keiner Weise ändern darf. Änderungen an einer Suchtabelle oder Ansicht können erst erkannt werden, wenn eine Umgestaltung erfolgt. Weitere Informationen zur erneuten Verarbeitung Ihrer Daten finden Sie unter Wiederaufbereitung und Verarbeitung.

Angenommen, Sie möchten veraltete DNS-Datensätze in die aktualisierten Datensätze konvertieren. Beide Datensätze werden in einer SQL-Datenbank gespeichert. Zur Durchführung dieser Aufgabe würden Sie auf eine Nachschlagetabelle verweisen, die aus der Datenbank generiert wird, und die veralteten DNS-Datensätze ersetzen.

Unsere Beispieltransformation durchsucht die Protokolleinträge nach dem s-dns-Feld und, falls vorhanden, wird die Suchtabelle VISUAL.LOOKUP verwendet, um den s-dns-Eintrag mit den Einträgen in der Spalte OLDDNS der Tabelle zu vergleichen. Befindet sich eine Zeile in der Tabelle, erhält das Ausgabefeld s-dns den aktualisierten DNS-Eintrag aus der Spalte NEWDNS der angegebenen Zeile.

Auf dieser Seite

Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now