Analizador de texto

Puede utilizar la herramienta de análisis de texto para analizar texto y utilizarlo en otros módulos de escenarios de Adobe Workfront Fusion. El Text parser no requiere una conexión.

Requisitos de acceso

Expanda para ver los requisitos de acceso para la funcionalidad en este artículo.
table 0-row-2 1-row-2 2-row-2 layout-auto html-authored no-header
paquete de Adobe Workfront

Cualquier paquete de flujo de trabajo de Adobe Workfront y cualquier paquete de integración y automatización de Adobe Workfront

Workfront Ultimate

Paquetes Workfront Prime y Select, con una compra adicional de Workfront Fusion.

Licencias de Adobe Workfront

Estándar

Trabajo o superior

Producto Si su organización tiene un paquete Select o Prime Workfront que no incluye la automatización y la integración de Workfront, su organización debe adquirir Adobe Workfront Fusion.

Para obtener más información sobre esta tabla, consulte Requisitos de acceso en la documentación.

Información de API del analizador de texto

El conector del analizador de texto utiliza lo siguiente:

Etiqueta de API
Versión 2

Text parser módulos y sus campos

Al configurar los módulos de Text parser, Adobe Workfront Fusion muestra los campos que se indican a continuación. El título en negrita en un módulo indica un campo obligatorio.

Si ve el botón Asignar encima de un campo o función, puede utilizarlo para establecer variables y funciones para ese campo. Para obtener más información, vea Asignar información de un módulo a otro.

Conmutador Asignar

Transformadores

Get Elements from HTML

Recupera los elementos deseados del código del HTML.

Continue the execution of the route even if the module finds no matches
Habilite esta opción para asegurarse de que el módulo no detenga el escenario si no devuelve resultados.
Element type

Seleccione el tipo de elemento que desea recuperar del código del HTML.

  • Image
  • Link
  • iFrame element(s)
HTML
Introduzca o asigne el código de HTML desde el que desea recuperar los tipos de elementos especificados.

Get Elements from text

Analiza elementos de texto en función del patrón determinado.

Input text
Introduzca o asigne el texto que desea analizar.
Pattern

Seleccione el patrón que refleje los elementos del texto que desee analizar.

Para introducir una expresión regular personalizada, seleccione Personalizado en la lista y, a continuación, introduzca la expresión personalizada en el campo Regex personalizada.

Ignore Duplicate Occurrences
Marque esta casilla para ignorar las repeticiones de un elemento de texto.

De HTML a texto

HTML
Introduzca el código de HTML que desea convertir en texto sin formato.
Line break
Seleccione el tipo de nueva línea (salto de línea).
Uppercase headings
Habilite esta opción para convertir el texto incluido en las etiquetas de encabezado (como <h2> </h2>) en texto en mayúsculas.

Patrón de coincidencia

El módulo Patrón de coincidencia le permite buscar y extraer elementos de cadena que coincidan con un patrón de búsqueda de un texto determinado. Este módulo utiliza expresiones regulares (también conocidas como regex o regexp).

Una expresión regular es una secuencia de caracteres en la que cada carácter es un metacarácter, que tiene un significado especial, o un carácter regular que tiene un significado literal. Estos caracteres y metacaracteres identifican un patrón que se puede utilizar para buscar texto. Por ejemplo, si desea buscar nombres, puede configurar una expresión regular para buscar un patrón que consista en dos palabras consecutivas que comiencen con mayúsculas. Las expresiones regulares son una potente herramienta para buscar y manipular texto.

El análisis de las expresiones regulares excede el ámbito de este artículo. Recomendamos los siguientes recursos:

  • Para obtener la lista completa de metacaracteres, consulte Expresiones regulares en los documentos web de MDN.
  • Para ver un tutorial sobre cómo crear expresiones regulares, recomendamos RegexOne.
  • Para experimentar con expresiones regulares, recomendamos el sitio web Expresiones regulares 101. Seleccione ECMAScript (JavaScript) FLAVOR en el panel izquierdo.
Pattern

Introduzca el patrón de expresión regular.

Ejemplo: [+-]?(\d+(\.\d+)?|\.\d+)([eE][+-]?\d+)? extrae todos los números del texto proporcionado.

Nota:

El patrón debe contener al menos un grupo de captura entre paréntesis (). Si el patrón no contiene ningún grupo de captura, el paquete de salida está vacío.

Global match
Habilite esta opción para recuperar todas las coincidencias del texto. Cada coincidencia se genera en un paquete independiente. Si esta opción está desactivada, el módulo recupera únicamente la primera entrada.
Case sensitive
Habilite esta opción para que este módulo distinga entre mayúsculas y minúsculas.
Multiline
Habilite esta opción para asegurarse de que los metacaracteres inicial y final (^ y $) coinciden con el principio o final de cada línea, no sólo con el principio o el final de toda la cadena de entrada.
Singleline
Habilite esta opción para asegurarse de que el punto (.) coincida con los caracteres de línea nueva (\n).
Continue the execution of the route even if the module returns no results
Habilite esta opción para asegurarse de que el módulo no detenga el escenario si no devuelve resultados.
Text
Introduzca o asigne el texto que desea que coincida con el patrón.

Reemplazar

Busca un valor o una expresión regular especificados en el texto introducido y reemplaza el resultado por el nuevo valor.

Pattern
Introduzca el término de búsqueda. También puede utilizar una expresión regular. Para obtener más información sobre la expresión regular, consulte el módulo Match Pattern.
New value
Introduzca el valor que desea reemplazar con el término de búsqueda.
Global match
Habilite esta opción para recuperar todas las coincidencias del texto. Cada coincidencia se genera en un paquete independiente. Si esta opción está desactivada, el módulo recupera únicamente la primera entrada.
Case sensitive
Habilite esta opción para que este módulo distinga entre mayúsculas y minúsculas.
Multiline
Habilite esta opción para asegurarse de que los metacaracteres inicial y final (^ y $) coinciden con el principio o final de cada línea, no sólo con el principio o el final de toda la cadena de entrada.
Singleline
Habilite esta opción para asegurarse de que el punto (.) coincida con los caracteres de línea nueva (\n).
Text
Introduzca el texto que desea buscar.

Extracción de datos

La extracción de datos, a veces denominada extracción web o recolección web, es el proceso de recopilar datos de sitios web y almacenarlos en la base de datos u hojas de cálculo locales. Si desea obtener datos de un sitio web y no está familiarizado con las expresiones regulares, puede utilizar una herramienta de extracción de datos.

Si la herramienta de extracción de datos proporciona una API REST, puede conectarse a ella a través de nuestros módulos HTTP universales y Webhooks.

Solución de problemas del analizador de texto

Utilice esta información si no consigue que el analizador de texto genere ninguna salida.

recommendation-more-help

Ejemplo:

El módulo debe analizar el tipo de archivo del documento de archivo "filename.docx" y la extensión del nombre de archivo varía de DOCX a PDF o CSV.

La expresión que puede elegir usar en este caso es ..+

Esta expresión regular normalmente daría como resultado una coincidencia completa.

Sin embargo, la implementación de esta expresión en el analizador de texto no da como resultado una coincidencia:

No hay coincidencia

La razón es que la “i” muestra solo el número de coincidencias por coincidencia, así que en este caso tenemos 2 coincidencias, por lo que después de la “i” hay un valor numérico 1 y 2. El caso de uso es que, si alguna vez necesita hacer coincidir o transferir datos a través de un filtro, solo el segundo valor coincidente puede especificar qué valor está representado mediante el valor numérico.

Coincidencia

Para poder obtener los valores de coincidencia necesarios para añadir corchetes a la parte que desea analizar (por ejemplo, para extraer de “filename.docx” solo “docx”), los corchetes deben aplicarse en , de acuerdo con la expresión regex que se utiliza en este escenario de caso.(.+)

Esto captura el DOCX, lo coloca en un grupo y deja el “.” fuera.

Obtener coincidencias

En la salida que se muestra en la imagen siguiente, el grupo de captura coincidirá con cualquier carácter (excepto para los terminadores de línea).

Salida

Otra solución que también incorpora regex es utilizar la función de reemplazo

{{replace("abcdefghijklmno pqr stuvw xyz.docx"; "/.\./"; ".")}}

A continuación, reemplace abcdefghijklmno pqr stuvw xyz.docx por la variable de nombre de archivo real.

7e1891ad-4d59-4355-88ab-a2e62ed7d1a3