Text parser
Du kan använda Text parser tool för att tolka text för användning i andra Adobe Workfront Fusion-scenariomoduler. Text parser kräver ingen anslutning.
Åtkomstkrav
Du måste ha följande åtkomst för att kunna använda funktionerna i den här artikeln:
table 0-row-2 1-row-2 2-row-2 3-row-2 layout-auto html-authored no-header | |
---|---|
Adobe Workfront package | Alla |
Adobe Workfront-licens |
Nytt: Standard eller Aktuell: Arbete eller högre |
Adobe Workfront Fusion-licens** | Workfront Fusion-licens krävs inte |
Produkt |
Nytt:
eller Aktuell: Din organisation måste köpa Adobe Workfront Fusion. |
Mer information om informationen i den här tabellen finns i Åtkomstkrav i dokumentationen.
Mer information om Adobe Workfront Fusion-licenser finns i Adobe Workfront Fusion-licenser.
API-information för textparser
Textparserkopplingen använder följande:
Text parser-moduler och deras fält
När du konfigurerar Text parser-moduler visas fälten som listas nedan i Adobe Workfront Fusion. En rubrik med fet stil i en modul visar ett obligatoriskt fält.
Om du ser kartknappen ovanför ett fält eller en funktion kan du använda den för att ange variabler och funktioner för det fältet. Mer information finns i Mappa information från en modul till en annan.
Transformers
Get Elements from HTML
Hämtar önskade element från HTML-kod.
Get Elements from text
Tolkar element från text baserat på det angivna mönstret.
HTML to Text
Match Pattern
Med modulen Match pattern kan du söka efter och extrahera strängelement som matchar ett sökmönster från en viss text. I den här modulen används reguljära uttryck (kallas även regex eller regexp).
Ett reguljärt uttryck är en teckensekvens där varje tecken antingen är ett metatecken med en speciell innebörd eller ett reguljärt tecken med en litteral betydelse. Dessa tecken och metatecken identifierar ett mönster som kan användas för att söka efter text. Om du t.ex. vill söka efter namn kan du skapa ett reguljärt uttryck som söker efter ett mönster som består av två ord i följd som börjar med versaler. Reguljära uttryck är ett kraftfullt verktyg för att söka efter och ändra text.
En diskussion om reguljära uttryck ligger utanför den här artikelns räckvidd. Vi rekommenderar följande resurser:
- En fullständig lista över metatecken finns i Reguljära uttryck i MDN-webbdokument.
- Om du vill ha en genomgång om hur du skapar reguljära uttryck rekommenderar vi RegexOne.
- Om du vill experimentera med reguljära uttryck rekommenderar vi webbplatsen Reguljära uttryck 101. Markera ECMAScript (JavaScript) FLAVOR i den vänstra panelen.
Replace
Söker efter ett angivet värde eller reguljärt uttryck i den angivna texten och ersätter resultatet med det nya värdet.
Dataskrapning
Dataskrapning, som ibland kallas webbskrapning, dataextrahering eller webbskörning, är processen att samla in data från webbplatser och lagra dem i din lokala databas eller kalkylblad. Om du vill skrapa data från en webbplats och inte känner till reguljära uttryck, kan du använda ett dataskrapningsverktyg.
Om dataskrapningsverktyget har ett REST API kan du ansluta till det via våra universella HTTP-moduler och Webhooks .
Felsökning av textparser
Använd den här informationen om du inte kan hämta en texttolk för att skapa utdata.
Exempel:
Modulen bör analysera filtypen för ett fildokument, "filename.docx", och filnamnets filnamnstillägg varierar från DOCX till PDF till CSV.
Uttrycket som du kan använda i det här fallet är ..+
Det här reguljära uttrycket resulterar vanligtvis i en fullständig matchning.
Om du implementerar det här uttrycket i texttolken resulterar det dock inte i någon matchning:
Anledningen till detta är att "i" endast visar antalet matchningar per matchning, så i det här fallet har vi två matchningar, och efter "i" finns därför ett numeriskt värde på 1 och 2. I det här exemplet används det om du någon gång behöver matcha eller skicka data via ett filter endast med det andra matchade värdet. Du kan ange vilket värde som representeras av det numeriska värdet.
För att kunna hämta de matchningsvärden som du behöver lägga till hakparenteser i den del som du vill analysera (till exempel för att extrahera från"filename.docx" -"docx" enbart), ska hakparenteserna tillämpas på , enligt det regex-uttryck som vi använder för det här scenariot.(.+)
Detta hämtar DOCX-filen, placerar den i en grupp och lämnar "." ur det.
I utdata som visas i bilden nedan kommer den hämtade gruppen att matcha alla tecken (förutom radavslutningar).
En annan tillfällig lösning som även innehåller regex är att använda funktionen replace
{{replace("abcdefghijklmno pqr stuvw xyz.docx"; "/.\./"; ".")}}
Ersätt sedan abcdefghijklmno pqr stuvw xyz.docx
med den faktiska filnamnsvariabeln.