Mehr über die Data Workbench Mitteilung zum Ende der Nutzungsdauer.
Die REMatch-Transformation ist eine pattern-Matching-Transformation, bei der reguläre Ausdrücke verwendet werden, um ein oder mehrere Muster anzugeben, nach denen gesucht und in der Eingabe erfasst werden soll.
Die Transformation erstellt ein Ausgabefeld für jedes erfasste Untermuster im regulären Ausdruck. Wenn der reguläre Ausdruck nicht mit dem Eingabefeld übereinstimmt, sind die Ausgaben leer, und wenn das Ausgabefeld bereits vorhanden ist, werden die Werte durch die leeren Werte ersetzt. Eine kurze Anleitung zur Verwendung regulärer Ausdrücke finden Sie unter Reguläre Ausdrücke.
Die REMatch Die Umwandlung funktioniert ähnlich wie die RETransform Transformation (siehe RETransform), das reguläre Ausdrücke verwendet, um eine Zeichenfolge zu erfassen und diese Zeichenfolge in einem einzigen Ausgabefeld zu speichern.
REMatch Analysiert eine Zeichenfolge effizienter als mehrere RETransform Umwandlungen oder einzelne RETransform Umwandlung, gefolgt von Flatten Umwandlung. Siehe Flatten.
Parameter | Beschreibung | Standard |
---|---|---|
Name | Deskriptiver Name der Transformation. Hier können Sie einen beliebigen Namen eingeben. | |
Groß-/Kleinschreibung | True oder false. Gibt an, ob bei der Übereinstimmung zwischen Groß- und Kleinschreibung unterschieden wird. | |
Kommentare | Optional. Anmerkungen zur Transformation. | |
Bedingung | Die Bedingungen, unter denen diese Umwandlung angewendet wird. | |
Ausdruck | Der reguläre Ausdruck, der für die Zuordnung verwendet wird. | |
Eingabe | Das Feld, mit dem der reguläre Ausdruck ausgewertet wird. | |
Ausgaben | Der Name der Ausgabezeichenfolge oder des Vektors. Bei Zeichenfolgen-Vektoren als Eingabe sind die Ausgaben auch Zeichenfolgen-Vektoren. Für jedes erfasste Untermuster im Ausdruck muss ein Ausgabefeld vorhanden sein. |
REMatch Transformationen können sehr langsam sein und einen Großteil der Datenverarbeitungszeit ausmachen.
In diesem Beispiel wird eine REMatch Durch die Umwandlung wird ein Datum im Format JJJJ-MM-TT in die Felder x Jahr, x Monat und x-Tag gegliedert. Für das Datum 2007-01-02 würden die Werte für x-Jahr, x-Monat und x-Tag 2007, 01 bzw. 02 betragen.