Analisador de texto

Você pode usar a Ferramenta de análise de texto para analisar o texto a ser usado em outros módulos de cenário do Adobe Workfront Fusion. O analisador de texto não requer uma conexão.

Requisitos de acesso

Expanda para visualizar os requisitos de acesso para a funcionalidade neste artigo.

Você deve ter o seguinte acesso para usar a funcionalidade neste artigo:

table 0-row-2 1-row-2 2-row-2 3-row-2 layout-auto html-authored no-header
Pacote do Adobe Workfront Qualquer
Licença do Adobe Workfront

Novo: Padrão

Ou

Atual: trabalho ou superior

Licença do Adobe Workfront Fusion** Nenhum requisito de licença do Workfront Fusion
Produto

Novo menu:

  • Selecionar ou pacote do Prime Workfront: sua organização deve comprar o Adobe Workfront Fusion.
  • Pacote do Ultimate Workfront: o Workfront Fusion está incluído.

Ou

Atual: sua organização deve comprar o Adobe Workfront Fusion.

Para obter mais detalhes sobre as informações nesta tabela, consulte Requisitos de acesso na documentação.

Para obter informações sobre licenças do Adobe Workfront Fusion, consulte licenças do Adobe Workfront Fusion.

Informações da API do analisador de texto

O conector do analisador de texto usa o seguinte:

Tag da API
v2

Módulos Analisador de texto e seus campos

Ao configurar módulos do Analisador de texto, o Adobe Workfront Fusion exibe os campos listados abaixo. Um título em negrito em um módulo indica um campo obrigatório.

Se você vir o botão de mapa acima de um campo ou função, poderá usá-lo para definir variáveis e funções para esse campo. Para obter mais informações, consulte Mapear informações de um módulo para outro.

Alternância de mapa

Transformadores

Obter Elementos do HTML

Recupera os elementos desejados do código HTML.

Continuar a execução da rota mesmo se o módulo não encontrar correspondências
Ative essa opção para garantir que o módulo não interrompa o cenário se não retornar resultados.
Tipo de elemento

Selecione o tipo de elemento que deseja recuperar do código HTML.

  • Imagem
  • Link
  • elemento(s) iFrame
HTML
Insira ou mapeie o código HTML do qual deseja recuperar os tipos de elemento especificados.

Obter Elementos do texto

Analisa os elementos do texto com base no padrão fornecido.

Texto de entrada
Insira ou mapeie o texto que deseja analisar.
Padrão

Selecione o padrão que reflete os elementos que você deseja analisar do texto.

Para inserir expressões regulares personalizadas, selecione Personalizado na lista e, em seguida, insira a expressão personalizada no campo Regex personalizado.

Ignorar Ocorrências Duplicadas
Marque essa caixa para ignorar ocorrências duplicadas de um elemento de texto.

HTML para texto

HTML
Insira o código HTML que deseja converter em texto sem formatação.
Quebra de linha
Selecione o tipo de nova linha (quebra de linha).
Cabeçalhos em maiúsculas
Habilite esta opção para converter o texto delimitado nas marcas de cabeçalho (como <h2> </h2>) em texto em maiúsculas.

Corresponder Padrão

O módulo Padrão de correspondência permite localizar e extrair elementos de cadeia de caracteres correspondentes a um padrão de pesquisa de um determinado texto. Esse módulo usa expressões regulares (também conhecidas como regex ou regexp).

Uma expressão regular é uma sequência de caracteres na qual cada caractere é um metacaractere, com um significado especial, ou um caractere regular que tem um significado literal. Esses caracteres e metacaracteres identificam um padrão que pode ser usado para pesquisar texto. Por exemplo, se você deseja pesquisar nomes, é possível configurar uma expressão regular para pesquisar um padrão que consiste em duas palavras consecutivas que começam com letras maiúsculas. As expressões regulares são uma ferramenta poderosa para pesquisar e manipular texto.

Uma discussão de expressões regulares está fora do escopo deste artigo. Recomendamos os seguintes recursos:

  • Para obter a lista completa de metacaracteres, consulte Expressões regulares em documentos da Web do MDN.
  • Para um tutorial sobre como criar expressões regulares, recomendamos RegexOne.
  • Para experimentar expressões regulares, recomendamos o site Expressões regulares 101. Selecione a VARIÁVEL ECMAScript (JavaScript) no painel esquerdo.
Padrão

Insira o padrão de expressão regular.

Exemplo: [+-]?(\d+(\.\d+)?|\.\d+)([eE][+-]?\d+)? extrai todos os numerais no texto fornecido.

Observação:

O padrão deve conter pelo menos um grupo de captura entre parênteses (). Se o padrão não contiver nenhum grupo de captura, o pacote de saída estará vazio.

Correspondência global
Habilite esta opção para recuperar todas as correspondências no texto. Cada correspondência é gerada em um pacote separado. Se essa opção estiver desativada, o módulo recuperará somente a primeira entrada.
Diferencia maiúsculas de minúsculas
Habilite esta opção para que este módulo trate o texto como sensível a maiúsculas e minúsculas.
Várias Linhas
Habilite esta opção para garantir que os metacaracteres de início e término (^ e $) correspondam ao início ou ao fim de cada linha, não apenas ao início ou ao fim de toda a cadeia de caracteres de entrada.
Linha Simples
Habilite esta opção para garantir que o ponto (.) corresponda aos caracteres de nova linha (\n).
Continuar a execução da rota mesmo se o módulo não retornar resultados
Ative essa opção para garantir que o módulo não interrompa o cenário se não retornar resultados.
Texto
Insira ou mapeie o texto que deseja corresponder ao padrão.

Replace

Pesquisa no texto inserido um valor especificado ou uma expressão regular e substitui o resultado pelo novo valor.

Padrão
Insira o termo de pesquisa. Você também pode usar uma expressão regular. Para obter mais detalhes sobre a expressão regular, consulte o módulo Padrão de Correspondência.
Novo valor
Insira o valor que você deseja substituir o termo de pesquisa.
Correspondência global
Habilite esta opção para recuperar todas as correspondências no texto. Cada correspondência é gerada em um pacote separado. Se essa opção estiver desativada, o módulo recuperará somente a primeira entrada.
Diferencia maiúsculas de minúsculas
Habilite esta opção para que este módulo trate o texto como sensível a maiúsculas e minúsculas.
Várias Linhas
Habilite esta opção para garantir que os metacaracteres de início e término (^ e $) correspondam ao início ou ao fim de cada linha, não apenas ao início ou ao fim de toda a cadeia de caracteres de entrada.
Linha Simples
Habilite esta opção para garantir que o ponto (.) corresponda aos caracteres de nova linha (\n).
Texto
Insira o texto a ser pesquisado.

Rascunho de dados

O raspamento de dados, às vezes chamado de raspagem da Web, extração de dados ou coleta da Web, é o processo de coletar dados de sites e armazená-los no banco de dados ou planilhas locais. Se quiser extrair dados de um site e não estiver familiarizado com expressões regulares, você poderá usar uma ferramenta de raspagem de dados.

Se a ferramenta de raspagem de dados fornecer uma REST API, você poderá se conectar a ela por meio de nossos módulos universais HTTP e Webhooks.

Solução de problemas do analisador de texto

Use essas informações se você não conseguir que um analisador de texto produza nenhuma saída.

recommendation-more-help

Exemplo:

O módulo deve analisar o tipo de arquivo de um documento de arquivo "filename.docx", e a extensão do nome do arquivo varia de DOCX para PDF para CSV.

A expressão que você pode escolher usar neste caso é ..+

Normalmente, essa expressão regular resultaria em uma correspondência completa.

No entanto, a implementação dessa expressão no analisador de texto não resulta em uma correspondência:

Sem correspondência

O motivo para isso é que o "i" mostra apenas o número de correspondências por correspondência, portanto, neste caso, temos 2 correspondências, portanto, depois do "i", há um valor numérico 1 e 2. O caso de uso para isso é que, se você precisar corresponder ou transmitir dados por um filtro somente o segundo valor correspondente, poderá especificar qual valor é representado pelo valor numérico.

Correspondência

Para obter os valores de correspondência necessários para adicionar colchetes à parte que deseja analisar (por exemplo, para extrair somente de "filename.docx" - "docx"), de acordo com a expressão regex que estamos usando para esse cenário de caso, os colchetes devem ser aplicados em .(.+)

Isso captura o DOCX, coloca-o em um grupo e deixa o "." fora dele.

Obter correspondências

Na saída mostrada na figura abaixo, o grupo de captura corresponderá a qualquer caractere (exceto para terminadores de linha).

Saída

Outra solução alternativa que também incorpora o regex é usar a função de substituição

{{replace("abcdefghijklmno pqr stuvw xyz.docx"; "/.\./"; ".")}}

Em seguida, substitua abcdefghijklmno pqr stuvw xyz.docx pela variável de nome de arquivo real.

7e1891ad-4d59-4355-88ab-a2e62ed7d1a3