Parser di testo
È possibile utilizzare lo strumento parser di testo per analizzare il testo da utilizzare in altri moduli di Adobe Workfront Fusion. Il parser Text non richiede una connessione.
Requisiti di accesso
| table 0-row-2 1-row-2 2-row-2 layout-auto html-authored no-header | |
|---|---|
| Pacchetto Adobe Workfront |
Qualsiasi pacchetto di flusso di lavoro Adobe Workfront e qualsiasi pacchetto di automazione e integrazione Adobe Workfront Workfront Ultimate Pacchetti Workfront Prime e Select, con un ulteriore acquisto di Workfront Fusion. |
| Licenze Adobe Workfront |
Standard Lavoro o superiore |
| Prodotto | Se la tua organizzazione dispone di un pacchetto Select o Prime Workfront che non include l’automazione e l’integrazione di Workfront, deve acquistare Adobe Workfront Fusion. |
Per ulteriori dettagli sulle informazioni contenute in questa tabella, vedere Requisiti di accesso nella documentazione.
Informazioni API parser di testo
Il connettore parser di testo utilizza quanto segue:
Moduli parser di testo e relativi campi
Quando configuri moduli parser di testo, Adobe Workfront Fusion visualizza i campi elencati di seguito. Un titolo in grassetto in un modulo indica un campo obbligatorio.
Se viene visualizzato il pulsante Mappa sopra un campo o una funzione, è possibile utilizzarlo per impostare variabili e funzioni per tale campo. Per ulteriori informazioni, vedere Mappare le informazioni da un modulo a un altro.
Trasformatori
Ottieni elementi da HTML
Recupera gli elementi desiderati dal codice HTML.
Ottieni elementi dal testo
Analizza gli elementi dal testo in base al pattern specificato.
Da HTML a testo
Corrispondenza pattern
Il modulo Match pattern consente di trovare ed estrarre elementi stringa che corrispondono a un pattern di ricerca da un determinato testo. Questo modulo utilizza espressioni regolari (note anche come regex o regexp).
Un’espressione regolare è una sequenza di caratteri in cui ogni carattere è un metacarattere, con un significato speciale, o un carattere regolare con un significato letterale. Questi caratteri e metacaratteri identificano un pattern che può essere utilizzato per la ricerca di testo. Ad esempio, se si desidera cercare i nomi, è possibile impostare un'espressione regolare per cercare un motivo costituito da due parole consecutive che iniziano con lettere maiuscole. Le espressioni regolari sono uno strumento utile per la ricerca e la manipolazione del testo.
Una discussione sulle espressioni regolari va oltre lo scopo di questo articolo. Si consiglia di utilizzare le risorse seguenti:
- Per l'elenco completo dei metacaratteri, vedere Espressioni regolari nei documenti Web MDN.
- Per un'esercitazione sulla creazione di espressioni regolari, consigliamo RegexOne.
- Per la sperimentazione con espressioni regolari, consigliamo il sito Web Espressioni regolari 101. Selezionare ECMAScript (JavaScript) FLAVOR nel pannello sinistro.
Replace
Cerca un valore o un'espressione regolare specificata nel testo immesso e sostituisce il risultato con il nuovo valore.
Scraping dei dati
Il raschiamento dei dati, a volte chiamato web scraping, estrazione dei dati o web harvesting, è il processo di raccolta dei dati dai siti web e di archiviazione nel database locale o nei fogli di calcolo. Se desideri estrarre i dati da un sito web e non hai familiarità con le espressioni regolari, puoi utilizzare uno strumento di raschiamento dei dati.
Se lo strumento di scarto dati fornisce un'API REST, puoi connetterti tramite i nostri moduli universali HTTP e Webhook.
Risoluzione dei problemi relativi al parser di testo
Utilizza queste informazioni se non riesci a ottenere un parser di testo per produrre alcun output.
Esempio:
Il modulo deve analizzare il tipo di file di un documento di file "filename.docx" e l’estensione del nome file varia da DOCX a PDF a CSV.
L'espressione che si può scegliere di utilizzare in questo caso è ..+
Questa espressione regolare normalmente darebbe luogo a una corrispondenza completa.
Tuttavia, l’implementazione di questa espressione nel parser di testo non produce una corrispondenza:
Il motivo è che la "i" mostra solo il numero di corrispondenze per partita, quindi in questo caso abbiamo 2 corrispondenze, quindi dopo la "i" c'è un valore numerico 1 e 2. Il caso d’uso prevede che, se dovesse essere necessario far corrispondere o trasmettere dati attraverso un filtro, solo il secondo valore corrispondente sia possibile specificare quale valore è rappresentato dal valore numerico.
Per ottenere i valori di corrispondenza necessari per aggiungere parentesi alla parte che si desidera analizzare, ad esempio per estrarre da "filename.docx" - solo "docx", in base all'espressione regex utilizzata per questo scenario, le parentesi devono essere applicate a .(.+)
Questo acquisisce il DOCX, lo inserisce in un gruppo e lascia il "." fuori di esso.
Nell'output mostrato nell'immagine seguente, il gruppo di cattura corrisponderà a qualsiasi carattere (ad eccezione dei terminatori di riga).
Un’altra soluzione alternativa che incorpora anche regex è l’utilizzo della funzione replace
{{replace("abcdefghijklmno pqr stuvw xyz.docx"; "/.\./"; ".")}}
Quindi sostituisci abcdefghijklmno pqr stuvw xyz.docx con la tua effettiva variabile di nome file.