Text-Parser
Sie können das Text-Parser-Tool verwenden, um Text zur Verwendung in anderen Adobe Workfront Fusion-Szenario-Modulen zu analysieren. Der Text-Parser erfordert keine Verbindung.
Zugriffsanforderungen
Sie müssen über folgenden Zugriff verfügen, um die Funktion in diesem Artikel verwenden zu können:
table 0-row-2 1-row-2 2-row-2 3-row-2 layout-auto html-authored no-header | |
---|---|
Adobe Workfront-Paket | Beliebig |
Adobe Workfront-Lizenz |
Neu: Standard Oder Aktuell: Arbeit oder höher |
Lizenz für Adobe Workfront Fusion** | Keine Workfront Fusion-Lizenzanforderung |
Produkt |
Neu:
Oder Aktuell: Ihr Unternehmen muss Adobe Workfront Fusion erwerben. |
Weitere Informationen zu den Informationen in dieser Tabelle finden Sie unter Zugriffsanforderungen in der Dokumentation.
Informationen zu Adobe Workfront Fusion-Lizenzen finden Sie unter Adobe Workfront Fusion-Lizenzen.
Text-Parser-API-Informationen
Der Text-Parser-Connector verwendet Folgendes:
Text-Parser Module und ihre Felder
Beim Konfigurieren von Text-Parser-Modulen zeigt Adobe Workfront Fusion die unten aufgeführten Felder an. Ein fett gedruckter Titel in einem Modul gibt ein erforderliches Feld an.
Wenn die Zuordnungsschaltfläche über einem Feld oder einer Funktion angezeigt wird, können Sie damit Variablen und Funktionen für dieses Feld festlegen. Weitere Informationen finden Sie unter Zuordnen von Informationen von einem Modul zu einem anderen.
Transformatoren
Elemente aus HTML abrufen
Ruft die gewünschten Elemente aus dem HTML-Code ab.
Elemente aus Text abrufen
Analysiert Elemente aus Text anhand des angegebenen Musters.
HTML in Text
Übereinstimmungsmuster
Das Match pattern-Modul ermöglicht es, Zeichenfolgenelemente zu finden und zu extrahieren, die einem Suchmuster aus einem bestimmten Text entsprechen. Dieses Modul verwendet reguläre Ausdrücke (auch als Regex oder Regex bezeichnet).
Ein regulärer Ausdruck ist eine Sequenz von Zeichen, in der jedes Zeichen entweder ein Metazeichen mit einer speziellen Bedeutung oder ein reguläres Zeichen mit einer wörtlichen Bedeutung ist. Diese Zeichen und Metazeichen identifizieren ein Muster, das für die Suche nach Text verwendet werden kann. Wenn Sie beispielsweise nach Namen suchen möchten, können Sie einen regulären Ausdruck einrichten, um nach einem Muster zu suchen, das aus zwei aufeinander folgenden Wörtern besteht, die mit Großbuchstaben beginnen. Reguläre Ausdrücke sind ein leistungsstarkes Tool zum Suchen und Bearbeiten von Text.
Eine Diskussion über reguläre Ausdrücke würde den Rahmen dieses Artikels sprengen. Wir empfehlen die folgenden Ressourcen:
- Eine vollständige Liste der Metazeichen finden Sie unter Reguläre Ausdrücke in MDN-Webdokumenten.
- Für ein Tutorial zum Erstellen regulärer Ausdrücke empfehlen wir RegexOne.
- Zum Experimentieren mit regulären Ausdrücken empfehlen wir die Website Reguläre Ausdrücke 101. Wählen Sie im linken Bedienfeld das ECMAScript (JavaScript)-FLAVOR aus.
Ersetzen
Durchsucht den eingegebenen Text nach einem angegebenen Wert oder regulären Ausdruck und ersetzt das Ergebnis durch den neuen Wert.
Daten-Scraping
Beim Daten-Scraping (manchmal auch als Web-Scraping, Datenextraktion oder Web-Sammeln bezeichnet) werden Daten von Websites erfasst und in Ihrer lokalen Datenbank oder in Tabellen gespeichert. Wenn Sie Daten von einer Website kratzen möchten und mit regulären Ausdrücken nicht vertraut sind, können Sie ein Tool zum Kratzen von Daten verwenden.
Wenn das Tool zum Daten-Scraping eine REST-API bereitstellt, können Sie über unsere universellen HTTP-Module und Webhooks-Module eine Verbindung herstellen.
Fehlerbehebung beim Text-Parser
Verwenden Sie diese Informationen, wenn Sie keinen Text-Parser erhalten können, um eine Ausgabe zu erzeugen.
Beispiel:
Das Modul sollte den Dateityp eines Dateidokuments „filename.docx“ analysieren, und die Dateinamenerweiterung variiert von DOCX zu PDF zu CSV.
Der Ausdruck, den Sie in diesem Fall verwenden können, lautet ..+
Dieser reguläre Ausdruck führt normalerweise zu einer vollständigen Übereinstimmung.
Die Implementierung dieses Ausdrucks in Ihrem Text-Parser führt jedoch nicht zu einer Übereinstimmung:
Der Grund dafür ist, dass das „i“ nur die Anzahl der Übereinstimmungen pro Übereinstimmung anzeigt. In diesem Fall haben wir also 2 Übereinstimmungen, daher gibt es nach dem „i“ einen numerischen Wert 1 und 2. Der Anwendungsfall hierfür besteht darin, dass Sie, falls Sie Daten jemals mit dem zweiten übereinstimmenden Wert abgleichen oder durch einen Filter übergeben müssen, angeben können, welcher Wert durch den numerischen Wert dargestellt wird.
Um die Übereinstimmungswerte abzurufen, die Sie benötigen, um dem zu analysierenden Teil Klammern hinzuzufügen (z. B. um nur aus „filename.docx“ - „docx“ zu extrahieren), sollten die Klammern gemäß dem Regex-Ausdruck, den wir für dieses Szenario verwenden, auf \ angewendet werden.(.+)
Erfasst das DOCX, platziert es in einer Gruppe und lässt das ".“ Raus damit.
In der im folgenden Bild gezeigten Ausgabe entspricht die Erfassungsgruppe einem beliebigen Zeichen (mit Ausnahme der Zeilenumbrüche).
Eine weitere Problemumgehung, die auch Regex enthält, ist die Verwendung der Funktion Ersetzen .
{{replace("abcdefghijklmno pqr stuvw xyz.docx"; "/.\./"; ".")}}
Ersetzen Sie dann abcdefghijklmno pqr stuvw xyz.docx
durch die eigentliche Dateinamenvariable .