Parser di testo

È possibile utilizzare lo strumento parser di testo per analizzare il testo da utilizzare in altri moduli di Adobe Workfront Fusion. Il parser Text non richiede una connessione.

Requisiti di accesso

Espandi per visualizzare i requisiti di accesso per la funzionalità in questo articolo.

Per utilizzare le funzionalità di questo articolo, è necessario disporre dei seguenti diritti di accesso:

table 0-row-2 1-row-2 2-row-2 3-row-2 layout-auto html-authored no-header
Pacchetto Adobe Workfront Qualsiasi
Licenza Adobe Workfront

Nuovo: Standard

Oppure

Corrente: Lavoro o versione successiva

Licenza Adobe Workfront Fusion** Nessun requisito di licenza per Workfront Fusion
Prodotto

Novità:

  • Seleziona o crea un pacchetto Prime Workfront: la tua organizzazione deve acquistare Adobe Workfront Fusion.
  • Pacchetto Ultimate Workfront: è incluso Workfront Fusion.

Oppure

Corrente: la tua organizzazione deve acquistare Adobe Workfront Fusion.

Per ulteriori dettagli sulle informazioni contenute in questa tabella, vedere Requisiti di accesso nella documentazione.

Per informazioni sulle licenze di Adobe Workfront Fusion, vedere Licenze di Adobe Workfront Fusion.

Informazioni API parser di testo

Il connettore parser di testo utilizza quanto segue:

Tag API
v2

Moduli parser di testo e relativi campi

Quando configuri moduli parser di testo, Adobe Workfront Fusion visualizza i campi elencati di seguito. Un titolo in grassetto in un modulo indica un campo obbligatorio.

Se viene visualizzato il pulsante Mappa sopra un campo o una funzione, è possibile utilizzarlo per impostare variabili e funzioni per tale campo. Per ulteriori informazioni, vedere Mappare le informazioni da un modulo a un altro.

Attiva/Disattiva mappa

Trasformatori

Ottieni elementi da HTML

Recupera gli elementi desiderati dal codice HTML.

Continua l'esecuzione della route anche se il modulo non trova corrispondenze
Abilita questa opzione per garantire che il modulo non interrompa lo scenario se non restituisce alcun risultato.
Tipo di elemento

Seleziona il tipo di elemento da recuperare dal codice HTML.

  • Image
  • Link
  • elementi iFrame
HTML
Immetti o mappa il codice HTML da cui desideri recuperare i tipi di elemento specificati.

Ottieni elementi dal testo

Analizza gli elementi dal testo in base al pattern specificato.

Testo di input
Immettere o mappare il testo che si desidera analizzare.
Pattern

Selezionate il motivo che riflette gli elementi da analizzare dal testo.

Per immettere un'espressione regolare personalizzata, selezionare Personalizzato dall'elenco, quindi immettere l'espressione personalizzata nel campo Regex personalizzato.

Ignora occorrenze duplicate
Selezionare questa casella per ignorare le occorrenze duplicate di un elemento di testo.

Da HTML a testo

HTML
Immetti il codice HTML da convertire in testo normale.
Interruzione di riga
Seleziona il tipo di nuova riga (interruzione di riga).
Intestazioni in maiuscolo
Abilita questa opzione per convertire in testo maiuscolo il testo racchiuso nei tag di intestazione (ad esempio <h2> </h2>).

Corrispondenza pattern

Il modulo Match pattern consente di trovare ed estrarre elementi stringa che corrispondono a un pattern di ricerca da un determinato testo. Questo modulo utilizza espressioni regolari (note anche come regex o regexp).

Un’espressione regolare è una sequenza di caratteri in cui ogni carattere è un metacarattere, con un significato speciale, o un carattere regolare con un significato letterale. Questi caratteri e metacaratteri identificano un pattern che può essere utilizzato per la ricerca di testo. Ad esempio, se si desidera cercare i nomi, è possibile impostare un'espressione regolare per cercare un motivo costituito da due parole consecutive che iniziano con lettere maiuscole. Le espressioni regolari sono uno strumento utile per la ricerca e la manipolazione del testo.

Una discussione sulle espressioni regolari va oltre lo scopo di questo articolo. Si consiglia di utilizzare le risorse seguenti:

  • Per l'elenco completo dei metacaratteri, vedere Espressioni regolari nei documenti Web MDN.
  • Per un'esercitazione sulla creazione di espressioni regolari, consigliamo RegexOne.
  • Per la sperimentazione con espressioni regolari, consigliamo il sito Web Espressioni regolari 101. Selezionare ECMAScript (JavaScript) FLAVOR nel pannello sinistro.
Pattern

Immettete il pattern di espressione regolare.

Esempio: [+-]?(\d+(\.\d+)?|\.\d+)([eE][+-]?\d+)? estrae tutti i numeri nel testo specificato.

Nota:

Il modello deve contenere almeno un gruppo di acquisizione tra parentesi (). Se il modello non contiene gruppi di acquisizione, il bundle di output è vuoto.

Corrispondenza globale
Abilita questa opzione per recuperare tutte le corrispondenze nel testo. Ogni corrispondenza viene generata in un bundle separato. Se questa opzione è disattivata, il modulo recupera solo la prima voce.
Distinzione maiuscole/minuscole
Abilita questa opzione per questo modulo per trattare il testo con distinzione tra maiuscole e minuscole.
Multiline
Abilitare questa opzione per assicurarsi che i metacaratteri iniziale e finale (^ e $) corrispondano all'inizio o alla fine di ogni riga, non solo all'inizio o alla fine dell'intera stringa di input.
Singleline
Abilitare questa opzione per assicurarsi che il punto (.) corrisponda ai caratteri di nuova riga (\n).
Continua l'esecuzione della route anche se il modulo non restituisce alcun risultato
Abilita questa opzione per garantire che il modulo non interrompa lo scenario se non restituisce alcun risultato.
Text
Immettere o mappare il testo che si desidera associare al motivo.

Replace

Cerca un valore o un'espressione regolare specificata nel testo immesso e sostituisce il risultato con il nuovo valore.

Pattern
Immettere il termine di ricerca. È inoltre possibile utilizzare un'espressione regolare. Per ulteriori dettagli sull'espressione regolare, fare riferimento al modulo Match Pattern.
Nuovo valore
Immettere il valore che si desidera sostituire al termine di ricerca.
Corrispondenza globale
Abilita questa opzione per recuperare tutte le corrispondenze nel testo. Ogni corrispondenza viene generata in un bundle separato. Se questa opzione è disattivata, il modulo recupera solo la prima voce.
Distinzione maiuscole/minuscole
Abilita questa opzione per questo modulo per trattare il testo con distinzione tra maiuscole e minuscole.
Multiline
Abilitare questa opzione per assicurarsi che i metacaratteri iniziale e finale (^ e $) corrispondano all'inizio o alla fine di ogni riga, non solo all'inizio o alla fine dell'intera stringa di input.
Singleline
Abilitare questa opzione per assicurarsi che il punto (.) corrisponda ai caratteri di nuova riga (\n).
Text
Immettere il testo in cui eseguire la ricerca.

Scraping dei dati

Il raschiamento dei dati, a volte chiamato web scraping, estrazione dei dati o web harvesting, è il processo di raccolta dei dati dai siti web e di archiviazione nel database locale o nei fogli di calcolo. Se desideri estrarre i dati da un sito web e non hai familiarità con le espressioni regolari, puoi utilizzare uno strumento di raschiamento dei dati.

Se lo strumento di scarto dati fornisce un'API REST, puoi connetterti tramite i nostri moduli universali HTTP e Webhook.

Risoluzione dei problemi relativi al parser di testo

Utilizza queste informazioni se non riesci a ottenere un parser di testo per produrre alcun output.

recommendation-more-help

Esempio:

Il modulo deve analizzare il tipo di file di un documento di file "filename.docx" e l’estensione del nome file varia da DOCX a PDF a CSV.

L'espressione che si può scegliere di utilizzare in questo caso è ..+

Questa espressione regolare normalmente darebbe luogo a una corrispondenza completa.

Tuttavia, l’implementazione di questa espressione nel parser di testo non produce una corrispondenza:

Nessuna corrispondenza

Il motivo è che la "i" mostra solo il numero di corrispondenze per partita, quindi in questo caso abbiamo 2 corrispondenze, quindi dopo la "i" c'è un valore numerico 1 e 2. Il caso d’uso prevede che, se dovesse essere necessario far corrispondere o trasmettere dati attraverso un filtro, solo il secondo valore corrispondente sia possibile specificare quale valore è rappresentato dal valore numerico.

Corrispondenza

Per ottenere i valori di corrispondenza necessari per aggiungere parentesi alla parte che si desidera analizzare, ad esempio per estrarre da "filename.docx" - solo "docx", in base all'espressione regex utilizzata per questo scenario, le parentesi devono essere applicate a .(.+)

Questo acquisisce il DOCX, lo inserisce in un gruppo e lascia il "." fuori di esso.

Ottieni corrispondenze

Nell'output mostrato nell'immagine seguente, il gruppo di cattura corrisponderà a qualsiasi carattere (ad eccezione dei terminatori di riga).

Output

Un’altra soluzione alternativa che incorpora anche regex è l’utilizzo della funzione replace

{{replace("abcdefghijklmno pqr stuvw xyz.docx"; "/.\./"; ".")}}

Quindi sostituisci abcdefghijklmno pqr stuvw xyz.docx con la tua effettiva variabile di nome file.

7e1891ad-4d59-4355-88ab-a2e62ed7d1a3