Text parser

Du kan använda Text parser tool för att tolka text för användning i andra Adobe Workfront Fusion-scenariomoduler. Text parser kräver ingen anslutning.

Åtkomstkrav

Expandera om du vill visa åtkomstkrav för funktionerna i den här artikeln.

Du måste ha följande åtkomst för att kunna använda funktionerna i den här artikeln:

table 0-row-2 1-row-2 2-row-2 3-row-2 layout-auto html-authored no-header
Adobe Workfront package Alla
Adobe Workfront-licens

Nytt: Standard

eller

Aktuell: Arbete eller högre

Adobe Workfront Fusion-licens** Workfront Fusion-licens krävs inte
Produkt

Nytt:

  • Select or Prime Workfront package: Your organization must purchase Adobe Workfront Fusion.
  • Ultimate Workfront-paket: Workfront Fusion ingår.

eller

Aktuell: Din organisation måste köpa Adobe Workfront Fusion.

Mer information om informationen i den här tabellen finns i Åtkomstkrav i dokumentationen.

Mer information om Adobe Workfront Fusion-licenser finns i Adobe Workfront Fusion-licenser.

API-information för textparser

Textparserkopplingen använder följande:

API-tagg
v2

Text parser-moduler och deras fält

När du konfigurerar Text parser-moduler visas fälten som listas nedan i Adobe Workfront Fusion. En rubrik med fet stil i en modul visar ett obligatoriskt fält.

Om du ser kartknappen ovanför ett fält eller en funktion kan du använda den för att ange variabler och funktioner för det fältet. Mer information finns i Mappa information från en modul till en annan.

Växla karta

Transformers

Get Elements from HTML

Hämtar önskade element från HTML-kod.

Continue the execution of the route even if the module finds no matches
Aktivera det här alternativet för att se till att modulen inte stoppar scenariot om den inte returnerar några resultat.
Element type

Markera den typ av element som du vill hämta från HTML-koden.

  • Image
  • Link
  • iFrame element(s)
HTML
Ange eller mappa den HTML-kod som du vill hämta de angivna elementtyperna från.

Get Elements from text

Tolkar element från text baserat på det angivna mönstret.

Input text
Ange eller mappa texten som du vill tolka.
Pattern

Markera mönstret som återspeglar elementen som du vill tolka från texten.

Om du vill ange ett anpassat reguljärt uttryck väljer du Anpassad i listan och anger det anpassade uttrycket i fältet Anpassad regex.

Ignore Duplicate Occurrences
Markera den här rutan om du vill ignorera dubblettförekomster av ett textelement.

HTML to Text

HTML
Ange den HTML-kod som du vill konvertera till oformaterad text.
Line break
Välj typ av radbrytning.
Uppercase headings
Aktivera det här alternativet om du vill konvertera text i rubriktaggar (till exempel <h2> </h2>) till versaler.

Match Pattern

Med modulen Match pattern kan du söka efter och extrahera strängelement som matchar ett sökmönster från en viss text. I den här modulen används reguljära uttryck (kallas även regex eller regexp).

Ett reguljärt uttryck är en teckensekvens där varje tecken antingen är ett metatecken med en speciell innebörd eller ett reguljärt tecken med en litteral betydelse. Dessa tecken och metatecken identifierar ett mönster som kan användas för att söka efter text. Om du t.ex. vill söka efter namn kan du skapa ett reguljärt uttryck som söker efter ett mönster som består av två ord i följd som börjar med versaler. Reguljära uttryck är ett kraftfullt verktyg för att söka efter och ändra text.

En diskussion om reguljära uttryck ligger utanför den här artikelns räckvidd. Vi rekommenderar följande resurser:

  • En fullständig lista över metatecken finns i Reguljära uttryck i MDN-webbdokument.
  • Om du vill ha en genomgång om hur du skapar reguljära uttryck rekommenderar vi RegexOne.
  • Om du vill experimentera med reguljära uttryck rekommenderar vi webbplatsen Reguljära uttryck 101. Markera ECMAScript (JavaScript) FLAVOR i den vänstra panelen.
Pattern

Ange mönstret för det reguljära uttrycket.

Exempel: [+-]?(\d+(\.\d+)?|\.\d+)([eE][+-]?\d+)? extraherar alla siffror i den angivna texten.

Obs!

Mönstret ska innehålla minst en hämtningsgrupp inom parentes (). Om mönstret inte innehåller några hämtningsgrupper är utdatapaketet tomt.

Global match
Aktivera det här alternativet om du vill hämta alla matchningar i texten. Alla matchningar görs i ett separat paket. Om det här alternativet är inaktiverat hämtar modulen endast den första posten.
Case sensitive
Aktivera det här alternativet för den här modulen för att behandla text som skiftlägeskänslig.
Multiline
Aktivera det här alternativet för att säkerställa att inledande och avslutande metatecken (^ och $) matchar början eller slutet av varje rad, inte bara början eller slutet av hela indatasträngen.
Singleline
Aktivera det här alternativet om du vill kontrollera att punkten (.) matchar radmatningstecken (\n).
Continue the execution of the route even if the module returns no results
Aktivera det här alternativet för att se till att modulen inte stoppar scenariot om den inte returnerar några resultat.
Text
Ange eller mappa den text som du vill matcha mönstret.

Replace

Söker efter ett angivet värde eller reguljärt uttryck i den angivna texten och ersätter resultatet med det nya värdet.

Pattern
Ange söktermen. Du kan också använda ett reguljärt uttryck. Mer information om det reguljära uttrycket finns i modulen Match Pattern.
New value
Ange det värde som ska ersätta söktermen.
Global match
Aktivera det här alternativet om du vill hämta alla matchningar i texten. Alla matchningar görs i ett separat paket. Om det här alternativet är inaktiverat hämtar modulen endast den första posten.
Case sensitive
Aktivera det här alternativet för den här modulen för att behandla text som skiftlägeskänslig.
Multiline
Aktivera det här alternativet för att säkerställa att inledande och avslutande metatecken (^ och $) matchar början eller slutet av varje rad, inte bara början eller slutet av hela indatasträngen.
Singleline
Aktivera det här alternativet om du vill kontrollera att punkten (.) matchar radmatningstecken (\n).
Text
Ange den text som du vill söka i.

Dataskrapning

Dataskrapning, som ibland kallas webbskrapning, dataextrahering eller webbskörning, är processen att samla in data från webbplatser och lagra dem i din lokala databas eller kalkylblad. Om du vill skrapa data från en webbplats och inte känner till reguljära uttryck, kan du använda ett dataskrapningsverktyg.

Om dataskrapningsverktyget har ett REST API kan du ansluta till det via våra universella HTTP-moduler och Webhooks .

Felsökning av textparser

Använd den här informationen om du inte kan hämta en texttolk för att skapa utdata.

recommendation-more-help

Exempel:

Modulen bör analysera filtypen för ett fildokument, "filename.docx", och filnamnets filnamnstillägg varierar från DOCX till PDF till CSV.

Uttrycket som du kan använda i det här fallet är ..+

Det här reguljära uttrycket resulterar vanligtvis i en fullständig matchning.

Om du implementerar det här uttrycket i texttolken resulterar det dock inte i någon matchning:

Ingen matchning

Anledningen till detta är att "i" endast visar antalet matchningar per matchning, så i det här fallet har vi två matchningar, och efter "i" finns därför ett numeriskt värde på 1 och 2. I det här exemplet används det om du någon gång behöver matcha eller skicka data via ett filter endast med det andra matchade värdet. Du kan ange vilket värde som representeras av det numeriska värdet.

Matcha

För att kunna hämta de matchningsvärden som du behöver lägga till hakparenteser i den del som du vill analysera (till exempel för att extrahera från"filename.docx" -"docx" enbart), ska hakparenteserna tillämpas på , enligt det regex-uttryck som vi använder för det här scenariot.(.+)

Detta hämtar DOCX-filen, placerar den i en grupp och lämnar "." ur det.

Hämta träffar

I utdata som visas i bilden nedan kommer den hämtade gruppen att matcha alla tecken (förutom radavslutningar).

Utdata

En annan tillfällig lösning som även innehåller regex är att använda funktionen replace

{{replace("abcdefghijklmno pqr stuvw xyz.docx"; "/.\./"; ".")}}

Ersätt sedan abcdefghijklmno pqr stuvw xyz.docx med den faktiska filnamnsvariabeln.

7e1891ad-4d59-4355-88ab-a2e62ed7d1a3