Text parser

Puede usar Text parser tool para analizar texto y utilizarlo en otros módulos de Adobe Workfront Fusion escenarios. Text parser no requiere una conexión.

Requisitos de acceso

Expanda para ver los requisitos de acceso para la funcionalidad en este artículo.

Para utilizar la funcionalidad de este artículo debe tener el siguiente acceso:

table 0-row-2 1-row-2 2-row-2 3-row-2 layout-auto html-authored no-header
paquete de Adobe Workfront Cualquiera
Licencia de Adobe Workfront

Nuevo: estándar

O

Actual: Trabajo o superior

Licencia de Adobe Workfront Fusion** No se requiere licencia de Workfront Fusion.
Producto

Nuevo:

  • Seleccione o paquete de Prime Workfront: su organización debe adquirir Adobe Workfront Fusion.
  • Paquete de Ultimate Workfront: Workfront Fusion está incluido.

O

Actual: Su organización debe adquirir Adobe Workfront Fusion.

Para obtener más información sobre esta tabla, consulte Requisitos de acceso en la documentación.

Para obtener información sobre Adobe Workfront Fusion licencias, consulte Adobe Workfront Fusion licencias.

Información de API del analizador de texto

El conector del analizador de texto utiliza lo siguiente:

Etiqueta de API
Versión 2

Módulos de Text parser y sus campos

Al configurar módulos de Text parser, Adobe Workfront Fusion muestra los campos que se indican a continuación. El título en negrita en un módulo indica un campo obligatorio.

Si ve el botón Asignar encima de un campo o función, puede utilizarlo para establecer variables y funciones para ese campo. Para obtener más información, vea Asignar información de un módulo a otro.

Conmutador Asignar

Transformadores

Get Elements from HTML

Recupera los elementos deseados del código del HTML.

Continue the execution of the route even if the module finds no matches
Active esta opción para asegurarse de que el módulo no detenga el escenario si no devuelve resultados.
Element type

Seleccione el tipo de elemento que desea recuperar del código del HTML.

  • Image
  • Link
  • iFrame element(s)
HTML
Introduzca o asigne el código de HTML desde el que desea recuperar los tipos de elementos especificados.

Get Elements from text

Analiza elementos de texto en función del patrón determinado.

Input text
Introduzca o asigne el texto que desea analizar.
Pattern
Seleccione el patrón que refleje los elementos del texto que desee analizar.
Ignore Duplicate Occurrences
Marque esta casilla para ignorar las repeticiones de un elemento de texto.

HTML to Text

HTML
Introduzca el código de HTML que desea convertir en texto sin formato.
Line break
Seleccione el tipo de nueva línea (salto de línea).
Uppercase headings
Active esta opción para convertir el texto incluido en las etiquetas de encabezado (como <h2> </h2>) en texto en mayúsculas.

Match Pattern

El módulo Match pattern le permite buscar y extraer elementos de cadena que coincidan con un patrón de búsqueda de un texto determinado. Este módulo utiliza expresiones regulares (también conocidas como regex o regexp).

Una expresión regular es una secuencia de caracteres en la que cada carácter es un metacarácter, que tiene un significado especial, o un carácter regular que tiene un significado literal. Estos caracteres y metacaracteres identifican un patrón que se puede utilizar para buscar texto. Por ejemplo, si desea buscar nombres, puede configurar una expresión regular para buscar un patrón que consista en dos palabras consecutivas que comiencen con mayúsculas. Las expresiones regulares son una potente herramienta para buscar y manipular texto.

El análisis de las expresiones regulares excede el ámbito de este artículo. Recomendamos los siguientes recursos:

  • Para obtener la lista completa de metacaracteres, consulte Expresiones regulares en los documentos web de MDN.
  • Para ver un tutorial sobre cómo crear expresiones regulares, recomendamos RegexOne.
  • Para experimentar con expresiones regulares, recomendamos el sitio web Expresiones regulares 101. Seleccione ECMAScript (JavaScript) FLAVOR en el panel izquierdo.
Pattern

Introduzca el patrón de expresión regular.

Ejemplo: [+-]?(\d+(\.\d+)?|\.\d+)([eE][+-]?\d+)? extrae todos los números del texto proporcionado.

Nota:

El patrón debe contener al menos un grupo de captura entre paréntesis (). Si el patrón no contiene ningún grupo de captura, el paquete de salida está vacío.

Global match
Active esta opción para recuperar todas las coincidencias del texto. Cada coincidencia se genera en un paquete independiente. Si esta opción está desactivada, el módulo recupera únicamente la primera entrada.
Case sensitive
Active esta opción para que este módulo distinga entre mayúsculas y minúsculas.
Multiline
Habilite esta opción para asegurarse de que los metacaracteres inicial y final (^ y $) coinciden con el principio o final de cada línea, no sólo con el principio o el final de toda la cadena de entrada.
Singleline
Habilite esta opción para asegurarse de que el punto (.) coincida con los caracteres de línea nueva (\n).
Continue the execution of the route even if the module returns no results
Active esta opción para asegurarse de que el módulo no detenga el escenario si no devuelve resultados.
Text
Introduzca o asigne el texto que desea que coincida con el patrón.

Replace

Busca un valor o una expresión regular especificados en el texto introducido y reemplaza el resultado por el nuevo valor.

Pattern
Introduzca el término de búsqueda. También puede utilizar una expresión regular. Para obtener más información sobre la expresión regular, consulte el módulo Match Pattern.
New value
Introduzca el valor que desea reemplazar con el término de búsqueda.
Global match
Active esta opción para recuperar todas las coincidencias del texto. Cada coincidencia se genera en un paquete independiente. Si esta opción está desactivada, el módulo recupera únicamente la primera entrada.
Case sensitive
Active esta opción para que este módulo distinga entre mayúsculas y minúsculas.
Multiline
Habilite esta opción para asegurarse de que los metacaracteres inicial y final (^ y $) coinciden con el principio o final de cada línea, no sólo con el principio o el final de toda la cadena de entrada.
Singleline
Habilite esta opción para asegurarse de que el punto (.) coincida con los caracteres de línea nueva (\n).
Text
Introduzca el texto que desea buscar.

Extracción de datos

La extracción de datos, a veces denominada extracción web o recolección web, es el proceso de recopilar datos de sitios web y almacenarlos en la base de datos u hojas de cálculo locales. Si desea obtener datos de un sitio web y no está familiarizado con las expresiones regulares, puede utilizar una herramienta de extracción de datos.

Si la herramienta de raspado de datos proporciona una API de REST, puede conectarse a ella a través de nuestros módulos HTTP universales y Webhooks.

Solución de problemas del analizador de texto

Utilice esta información si no consigue que el analizador de texto genere ninguna salida.

recommendation-more-help

Ejemplo:

El módulo debe analizar el tipo de archivo del documento de archivo "filename.docx" y la extensión del nombre de archivo varía de DOCX a PDF o CSV.

La expresión que puede elegir usar en este caso es ..+

Esta expresión regular normalmente daría como resultado una coincidencia completa.

Sin embargo, la implementación de esta expresión en el analizador de texto no da como resultado una coincidencia:

No hay coincidencia

La razón es que la “i” muestra solo el número de coincidencias por coincidencia, así que en este caso tenemos 2 coincidencias, por lo que después de la “i” hay un valor numérico 1 y 2. El caso de uso es que, si alguna vez necesita hacer coincidir o transferir datos a través de un filtro, solo el segundo valor coincidente puede especificar qué valor está representado mediante el valor numérico.

Coincidencia

Para poder obtener los valores de coincidencia necesarios para añadir corchetes a la parte que desea analizar (por ejemplo, para extraer de “filename.docx” solo “docx”), los corchetes deben aplicarse en , de acuerdo con la expresión regex que se utiliza en este escenario de caso.(.+)

Esto captura el DOCX, lo coloca en un grupo y deja el “.” fuera.

Obtener coincidencias

En la salida que se muestra en la imagen siguiente, el grupo de captura coincidirá con cualquier carácter (excepto para los terminadores de línea).

Salida

Otra solución que también incorpora regex es utilizar la función de reemplazo

{{replace("abcdefghijklmno pqr stuvw xyz.docx"; "/.\./"; ".")}}

A continuación, reemplace abcdefghijklmno pqr stuvw xyz.docx por la variable de nombre de archivo real.

7e1891ad-4d59-4355-88ab-a2e62ed7d1a3