Text parser

Met de Text parser tool kunt u tekst parseren voor gebruik in andere Adobe Workfront Fusion-scenario-modules. Voor Text parser is geen verbinding vereist.

Toegangsvereisten

Breid uit om de toegangseisen voor de functionaliteit in dit artikel weer te geven.

U moet de volgende toegang hebben om de functionaliteit in dit artikel te kunnen gebruiken:

table 0-row-2 1-row-2 2-row-2 3-row-2 layout-auto html-authored no-header
Adobe Workfront-pakket Alle
Adobe Workfront-licentie

Nieuw: Standaard

of

Huidig: Werk of hoger

Adobe Workfront Fusion-licentie** Geen Workfront Fusion-licentievereiste
Product

Nieuw:

  • Select- of Prime Workfront-pakket: uw organisatie moet Adobe Workfront Fusion aanschaffen.
  • Ultimate Workfront-pakket: Workfront Fusion is inbegrepen.

of

Huidig: Uw organisatie moet Adobe Workfront Fusion aanschaffen.

Voor meer detail over de informatie in deze lijst, zie vereisten van de Toegang in documentatie.

Voor informatie over de vergunningen van de Fusie van Adobe Workfront, zie de Fusie van Adobe Workfront vergunningen.

API-informatie voor tekstparser

De schakelaar van de parser van de Tekst gebruikt het volgende:

API-tag
v2

Text parser modules en hun velden

Wanneer u Text parser modules configureert, geeft Adobe Workfront Fusion de onderstaande velden weer. Een bolde titel in een module wijst op een vereist gebied.

Als u de kaartknoop boven een gebied of een functie ziet, kunt u het gebruiken om variabelen en functies voor dat gebied te plaatsen. Voor meer informatie, zie informatie van de Kaart van één module aan een andere.

Kaart knevel

Transformatoren

Get Elements from HTML

Haalt de gewenste elementen op uit de HTML-code.

Continue the execution of the route even if the module finds no matches
Schakel deze optie in om ervoor te zorgen dat de module het scenario niet stopt als er geen resultaten worden geretourneerd.
Element type

Selecteer het elementtype dat u wilt ophalen uit de HTML-code.

  • Image
  • Link
  • iFrame element(s)
HTML
Voer de HTML-code in of wijs deze toe waaruit u de opgegeven elementtypen wilt ophalen.

Get Elements from text

Hiermee parseert u elementen van tekst op basis van het opgegeven patroon.

Input text
Typ of wijs de tekst toe die u wilt parseren.
Pattern

Selecteer het patroon dat de elementen weerspiegelt die u in de tekst wilt parseren.

Als u een aangepaste reguliere expressie wilt invoeren, selecteert u Aangepast in de lijst en voert u de aangepaste expressie in het veld Aangepast regex in.

Ignore Duplicate Occurrences
Schakel dit vakje in om dubbele instanties van een tekstelement te negeren.

HTML to Text

HTML
Voer de HTML-code in die u wilt omzetten in onbewerkte tekst.
Line break
Selecteer het type nieuwe regel (regeleinde).
Uppercase headings
Schakel deze optie in om tekst tussen kopcodes (zoals <h2> </h2>) om te zetten in hoofdletters.

Match Pattern

In de module Match pattern kunt u zoeken naar tekenreekselementen die overeenkomen met een zoekpatroon in een bepaalde tekst. Deze module gebruikt reguliere expressies (ook wel regex of regexp genoemd).

Een reguliere expressie is een reeks tekens waarin elk teken een metateken is met een speciale betekenis of een regulier teken met een letterlijke betekenis. Met deze teken- en metatekens wordt een patroon geïdentificeerd dat kan worden gebruikt voor het zoeken naar tekst. Als u bijvoorbeeld naar namen wilt zoeken, kunt u een reguliere expressie instellen om te zoeken naar een patroon dat bestaat uit twee opeenvolgende woorden die beginnen met hoofdletters. Reguliere expressies zijn een krachtig gereedschap voor het zoeken en bewerken van tekst.

Een discussie over reguliere expressies valt buiten het toepassingsgebied van dit artikel. Wij adviseren de volgende middelen:

  • Voor de volledige lijst van metacharacters, zie Reguliere uitdrukkingenin MDN Web docs.
  • Voor een leerprogramma op hoe te om regelmatige uitdrukkingen tot stand te brengen, adviseren wij RegexOne.
  • Voor het experimenteren met regelmatige uitdrukkingen, adviseren wij de Reguliere Uitdrukkingen 101website. Selecteer de ECMAScript-FLAVOR (JavaScript) in het linkerdeelvenster.
Pattern

Voer het reguliere-expressiepatroon in.

Voorbeeld: [+-]?(\d+(\.\d+)?|\.\d+)([eE][+-]?\d+)? haalt alle cijfers in de verstrekte tekst uit.

Opmerking:

Het patroon moet ten minste één vastleggroep tussen haakjes () bevatten. Als het patroon geen vastleggingsgroepen bevat, is de uitvoerbundel leeg.

Global match
Schakel deze optie in om alle overeenkomsten in de tekst op te halen. Elke overeenkomst wordt uitgevoerd in een afzonderlijke bundel. Als deze optie is uitgeschakeld, haalt de module alleen het eerste item op.
Case sensitive
Schakel deze optie voor deze module in om tekst als hoofdlettergevoelig te behandelen.
Multiline
Schakel deze optie in om ervoor te zorgen dat metatekens aan het begin en einde (^ en $ ) overeenkomen met het begin of einde van elke regel, en niet alleen met het uiterste begin of einde van de gehele invoertekenreeks.
Singleline
Schakel deze optie in om ervoor te zorgen dat de punt (.) overeenkomt met nieuwe-regeltekens (\n).
Continue the execution of the route even if the module returns no results
Schakel deze optie in om ervoor te zorgen dat de module het scenario niet stopt als er geen resultaten worden geretourneerd.
Text
Voer de tekst in of wijs de tekst toe die u aan het patroon wilt aanpassen.

Replace

Zoekt de ingevoerde tekst naar een opgegeven waarde of reguliere expressie en vervangt het resultaat door de nieuwe waarde.

Pattern
Voer de zoekterm in. U kunt ook een reguliere expressie gebruiken. Zie de module Match Pattern voor meer informatie over de reguliere expressie.
New value
Voer de waarde in die u de zoekterm wilt vervangen.
Global match
Schakel deze optie in om alle overeenkomsten in de tekst op te halen. Elke overeenkomst wordt uitgevoerd in een afzonderlijke bundel. Als deze optie is uitgeschakeld, haalt de module alleen het eerste item op.
Case sensitive
Schakel deze optie voor deze module in om tekst als hoofdlettergevoelig te behandelen.
Multiline
Schakel deze optie in om ervoor te zorgen dat metatekens aan het begin en einde (^ en $ ) overeenkomen met het begin of einde van elke regel, en niet alleen met het uiterste begin of einde van de gehele invoertekenreeks.
Singleline
Schakel deze optie in om ervoor te zorgen dat de punt (.) overeenkomt met nieuwe-regeltekens (\n).
Text
Voer de tekst in die u wilt doorzoeken.

Gegevensovervulling

Het schrapen van gegevens, soms genoemd Webschrapping, gegevensextractie, of Web het oogsten, is het proces om gegevens van websites te verzamelen en het op te slaan in uw lokale gegevensbestand of spreadsheets. Als u gegevens van een website wilt verwijderen en u niet bekend bent met reguliere expressies, kunt u een gereedschap voor het verwijderen van gegevens gebruiken.

Als het hulpmiddel van de gegevensschrapping REST API verstrekt, kunt u met het via onze universele HTTP modulesen Webhooksmodules verbinden.

Problemen met tekstparsering

Gebruik deze informatie als u geen tekstparser kunt krijgen om output te veroorzaken.

recommendation-more-help

Voorbeeld:

De module moet het bestandstype van het bestandsdocument filename.docx parseren en de bestandsextensie varieert van DOCX tot PDF tot CSV.

De expressie die u in dit geval kunt gebruiken, is ..+

Deze reguliere expressie resulteert normaal gesproken in een volledige overeenkomst.

Het implementeren van deze expressie in uw tekstparser resulteert echter niet in een overeenkomst:

Geen gelijke

De reden hiervoor is dat "i"slechts het aantal gelijken per gelijke toont zodat in dit geval, hebben wij 2 gelijken, daarom nadat "i"er een numerieke waarde 1 en 2 is. Het gebruik hiervan is dat als u ooit gegevens via een filter moet aanpassen of doorgeven, alleen de tweede overeenkomende waarde kan worden opgegeven welke waarde wordt vertegenwoordigd door de numerieke waarde.

Gelijke

Als u de overeenkomende waarden wilt ophalen die u nodig hebt om haakjes toe te voegen aan het onderdeel dat u wilt parseren (bijvoorbeeld als u wilt extraheren uit "filename.docx" - alleen "docx"), moeten de haakjes volgens de regex-expressie die we in dit casescenario gebruiken, worden toegepast op .(.+)

Hierdoor wordt de DOCX vastgelegd, in een groep geplaatst en de "." van het.

krijgt gelijken

In de uitvoer die in de onderstaande afbeelding wordt weergegeven, komt de vastgelegde groep overeen met elk willekeurig teken (behalve regeleinde).

Output

Een andere oplossing die ook regex opneemt, gebruikt de vervangingsfunctie

{{replace("abcdefghijklmno pqr stuvw xyz.docx"; "/.\./"; ".")}}

Vervang abcdefghijklmno pqr stuvw xyz.docx vervolgens door de werkelijke bestandsnaamvariabele.

7e1891ad-4d59-4355-88ab-a2e62ed7d1a3