Parser di testo
È possibile utilizzare lo strumento parser di testo per analizzare il testo da utilizzare in altri moduli di Adobe Workfront Fusion. Il parser Text non richiede una connessione.
Requisiti di accesso
Per utilizzare le funzionalità di questo articolo, è necessario disporre dei seguenti diritti di accesso:
table 0-row-2 1-row-2 2-row-2 3-row-2 layout-auto html-authored no-header | |
---|---|
Pacchetto Adobe Workfront | Qualsiasi |
Licenza Adobe Workfront |
Nuovo: Standard Oppure Corrente: Lavoro o versione successiva |
Licenza Adobe Workfront Fusion** | Nessun requisito di licenza per Workfront Fusion |
Prodotto |
Novità:
Oppure Corrente: la tua organizzazione deve acquistare Adobe Workfront Fusion. |
Per ulteriori dettagli sulle informazioni contenute in questa tabella, vedere Requisiti di accesso nella documentazione.
Per informazioni sulle licenze di Adobe Workfront Fusion, vedere Licenze di Adobe Workfront Fusion.
Informazioni API parser di testo
Il connettore parser di testo utilizza quanto segue:
Moduli parser di testo e relativi campi
Quando configuri moduli parser di testo, Adobe Workfront Fusion visualizza i campi elencati di seguito. Un titolo in grassetto in un modulo indica un campo obbligatorio.
Se viene visualizzato il pulsante Mappa sopra un campo o una funzione, è possibile utilizzarlo per impostare variabili e funzioni per tale campo. Per ulteriori informazioni, vedere Mappare le informazioni da un modulo a un altro.
Trasformatori
Ottieni elementi da HTML
Recupera gli elementi desiderati dal codice HTML.
Ottieni elementi dal testo
Analizza gli elementi dal testo in base al pattern specificato.
Da HTML a testo
Corrispondenza pattern
Il modulo Match pattern consente di trovare ed estrarre elementi stringa che corrispondono a un pattern di ricerca da un determinato testo. Questo modulo utilizza espressioni regolari (note anche come regex o regexp).
Un’espressione regolare è una sequenza di caratteri in cui ogni carattere è un metacarattere, con un significato speciale, o un carattere regolare con un significato letterale. Questi caratteri e metacaratteri identificano un pattern che può essere utilizzato per la ricerca di testo. Ad esempio, se si desidera cercare i nomi, è possibile impostare un'espressione regolare per cercare un motivo costituito da due parole consecutive che iniziano con lettere maiuscole. Le espressioni regolari sono uno strumento utile per la ricerca e la manipolazione del testo.
Una discussione sulle espressioni regolari va oltre lo scopo di questo articolo. Si consiglia di utilizzare le risorse seguenti:
- Per l'elenco completo dei metacaratteri, vedere Espressioni regolari nei documenti Web MDN.
- Per un'esercitazione sulla creazione di espressioni regolari, consigliamo RegexOne.
- Per la sperimentazione con espressioni regolari, consigliamo il sito Web Espressioni regolari 101. Selezionare ECMAScript (JavaScript) FLAVOR nel pannello sinistro.
Replace
Cerca un valore o un'espressione regolare specificata nel testo immesso e sostituisce il risultato con il nuovo valore.
Scraping dei dati
Il raschiamento dei dati, a volte chiamato web scraping, estrazione dei dati o web harvesting, è il processo di raccolta dei dati dai siti web e di archiviazione nel database locale o nei fogli di calcolo. Se desideri estrarre i dati da un sito web e non hai familiarità con le espressioni regolari, puoi utilizzare uno strumento di raschiamento dei dati.
Se lo strumento di scarto dati fornisce un'API REST, puoi connetterti tramite i nostri moduli universali HTTP e Webhook.
Risoluzione dei problemi relativi al parser di testo
Utilizza queste informazioni se non riesci a ottenere un parser di testo per produrre alcun output.
Esempio:
Il modulo deve analizzare il tipo di file di un documento di file "filename.docx" e l’estensione del nome file varia da DOCX a PDF a CSV.
L'espressione che si può scegliere di utilizzare in questo caso è ..+
Questa espressione regolare normalmente darebbe luogo a una corrispondenza completa.
Tuttavia, l’implementazione di questa espressione nel parser di testo non produce una corrispondenza:
Il motivo è che la "i" mostra solo il numero di corrispondenze per partita, quindi in questo caso abbiamo 2 corrispondenze, quindi dopo la "i" c'è un valore numerico 1 e 2. Il caso d’uso prevede che, se dovesse essere necessario far corrispondere o trasmettere dati attraverso un filtro, solo il secondo valore corrispondente sia possibile specificare quale valore è rappresentato dal valore numerico.
Per ottenere i valori di corrispondenza necessari per aggiungere parentesi alla parte che si desidera analizzare, ad esempio per estrarre da "filename.docx" - solo "docx", in base all'espressione regex utilizzata per questo scenario, le parentesi devono essere applicate a .(.+)
Questo acquisisce il DOCX, lo inserisce in un gruppo e lascia il "." fuori di esso.
Nell'output mostrato nell'immagine seguente, il gruppo di cattura corrisponderà a qualsiasi carattere (ad eccezione dei terminatori di riga).
Un’altra soluzione alternativa che incorpora anche regex è l’utilizzo della funzione replace
{{replace("abcdefghijklmno pqr stuvw xyz.docx"; "/.\./"; ".")}}
Quindi sostituisci abcdefghijklmno pqr stuvw xyz.docx
con la tua effettiva variabile di nome file.