Analisador de texto
Você pode usar a Ferramenta de análise de texto para analisar o texto a ser usado em outros módulos de cenário do Adobe Workfront Fusion. O analisador de texto não requer uma conexão.
Requisitos de acesso
Você deve ter o seguinte acesso para usar a funcionalidade neste artigo:
table 0-row-2 1-row-2 2-row-2 3-row-2 layout-auto html-authored no-header | |
---|---|
Pacote do Adobe Workfront | Qualquer |
Licença do Adobe Workfront |
Novo: Padrão Ou Atual: trabalho ou superior |
Licença do Adobe Workfront Fusion** | Nenhum requisito de licença do Workfront Fusion |
Produto |
Novo menu:
Ou Atual: sua organização deve comprar o Adobe Workfront Fusion. |
Para obter mais detalhes sobre as informações nesta tabela, consulte Requisitos de acesso na documentação.
Para obter informações sobre licenças do Adobe Workfront Fusion, consulte licenças do Adobe Workfront Fusion.
Informações da API do analisador de texto
O conector do analisador de texto usa o seguinte:
Módulos Analisador de texto e seus campos
Ao configurar módulos do Analisador de texto, o Adobe Workfront Fusion exibe os campos listados abaixo. Um título em negrito em um módulo indica um campo obrigatório.
Se você vir o botão de mapa acima de um campo ou função, poderá usá-lo para definir variáveis e funções para esse campo. Para obter mais informações, consulte Mapear informações de um módulo para outro.
Transformadores
Obter Elementos do HTML
Recupera os elementos desejados do código HTML.
Obter Elementos do texto
Analisa os elementos do texto com base no padrão fornecido.
HTML para texto
Corresponder Padrão
O módulo Padrão de correspondência permite localizar e extrair elementos de cadeia de caracteres correspondentes a um padrão de pesquisa de um determinado texto. Esse módulo usa expressões regulares (também conhecidas como regex ou regexp).
Uma expressão regular é uma sequência de caracteres na qual cada caractere é um metacaractere, com um significado especial, ou um caractere regular que tem um significado literal. Esses caracteres e metacaracteres identificam um padrão que pode ser usado para pesquisar texto. Por exemplo, se você deseja pesquisar nomes, é possível configurar uma expressão regular para pesquisar um padrão que consiste em duas palavras consecutivas que começam com letras maiúsculas. As expressões regulares são uma ferramenta poderosa para pesquisar e manipular texto.
Uma discussão de expressões regulares está fora do escopo deste artigo. Recomendamos os seguintes recursos:
- Para obter a lista completa de metacaracteres, consulte Expressões regulares em documentos da Web do MDN.
- Para um tutorial sobre como criar expressões regulares, recomendamos RegexOne.
- Para experimentar expressões regulares, recomendamos o site Expressões regulares 101. Selecione a VARIÁVEL ECMAScript (JavaScript) no painel esquerdo.
Replace
Pesquisa no texto inserido um valor especificado ou uma expressão regular e substitui o resultado pelo novo valor.
Rascunho de dados
O raspamento de dados, às vezes chamado de raspagem da Web, extração de dados ou coleta da Web, é o processo de coletar dados de sites e armazená-los no banco de dados ou planilhas locais. Se quiser extrair dados de um site e não estiver familiarizado com expressões regulares, você poderá usar uma ferramenta de raspagem de dados.
Se a ferramenta de raspagem de dados fornecer uma REST API, você poderá se conectar a ela por meio de nossos módulos universais HTTP e Webhooks.
Solução de problemas do analisador de texto
Use essas informações se você não conseguir que um analisador de texto produza nenhuma saída.
Exemplo:
O módulo deve analisar o tipo de arquivo de um documento de arquivo "filename.docx", e a extensão do nome do arquivo varia de DOCX para PDF para CSV.
A expressão que você pode escolher usar neste caso é ..+
Normalmente, essa expressão regular resultaria em uma correspondência completa.
No entanto, a implementação dessa expressão no analisador de texto não resulta em uma correspondência:
O motivo para isso é que o "i" mostra apenas o número de correspondências por correspondência, portanto, neste caso, temos 2 correspondências, portanto, depois do "i", há um valor numérico 1 e 2. O caso de uso para isso é que, se você precisar corresponder ou transmitir dados por um filtro somente o segundo valor correspondente, poderá especificar qual valor é representado pelo valor numérico.
Para obter os valores de correspondência necessários para adicionar colchetes à parte que deseja analisar (por exemplo, para extrair somente de "filename.docx" - "docx"), de acordo com a expressão regex que estamos usando para esse cenário de caso, os colchetes devem ser aplicados em .(.+)
Isso captura o DOCX, coloca-o em um grupo e deixa o "." fora dele.
Na saída mostrada na figura abaixo, o grupo de captura corresponderá a qualquer caractere (exceto para terminadores de linha).
Outra solução alternativa que também incorpora o regex é usar a função de substituição
{{replace("abcdefghijklmno pqr stuvw xyz.docx"; "/.\./"; ".")}}
Em seguida, substitua abcdefghijklmno pqr stuvw xyz.docx
pela variável de nome de arquivo real.