文本分析器

您可以使用文本解析器工具来解析要在其他Adobe Workfront Fusion方案模块中使用的文本。 文本分析器不需要连接。

访问要求

您必须具有以下权限才能使用本文中的功能:

Adobe Workfront 计划*
Pro或更高版本
Adobe Workfront 许可证*
计划,工作
Adobe Workfront Fusion 许可证**

当前许可证要求:无Workfront Fusion许可证要求。

旧版许可证要求:Workfront Fusion for Work Automation and Integration,Workfront Fusion for Work Automation

产品

当前产品要求:如果您有Select或Prime Adobe Workfront计划,则贵组织必须购买Adobe Workfront Fusion和Adobe Workfront才能使用本文中描述的功能。 Workfront Fusion包含在Ultimate Workfront计划中。

旧版产品要求:您的组织必须购买Adobe Workfront Fusion和Adobe Workfront,才能使用本文中介绍的功能。

要了解您拥有什么计划、许可证类型或访问权限,请与Workfront管理员联系。

有关Adobe Workfront Fusion许可证的信息,请参阅Adobe Workfront Fusion 许可证

文本分析器模块及其字段

配置文本分析器模块时,Adobe Workfront Fusion显示下面列出的字段。 模块中的粗体标题表示必填字段。

如果看到字段或函数上方的映射按钮,则可以使用该按钮设置该字段的变量和函数。 有关详细信息,请参阅在 Adobe Workfront Fusion中将信息从一个模块映射到另一个模块。

变压器

从HTML获取元素

从HTML代码中检索所需的元素。

即使模块找不到匹配项,仍继续执行路由
启用此选项以确保模块在未返回任何结果时不会停止场景。
元素类型

选择要从HTML代码中检索的元素类型。

  • 图像
  • 链接
  • iFrame元素
HTML
输入或映射要从中检索指定元素类型的HTML代码。

从文本中获取元素

根据给定的模式解析文本中的元素。

输入文本
输入或映射要分析的文本。
模式
选择反映要从文本中解析的元素的图案。
忽略重复发生次数
选中此框可忽略文本元素的重复出现次数。

文本HTML

HTML
输入要转换为纯文本的HTML代码。
换行符
选择换行符(换行符)的类型。
大写标题
启用此选项可将标题标记中包含的文本(如<h2> </h2>)转换为大写文本。

匹配模式

匹配模式模块允许您从给定文本中查找和提取与搜索模式匹配的字符串元素。 此模块使用正则表达式(也称为正则表达式或正则表达式)。

正则表达式是一系列字符,其中每个字符要么是具有特殊意义的元字符,要么是具有字面含义的常规字符。 这些字符和元字符标识了可用于搜索文本的模式。 例如,如果要搜索名称,可设置正则表达式以搜索由两个以大写字母开头的连续单词组成的模式。 正则表达式是用于搜索和处理文本的强大工具。

有关正则表达式的讨论超出了本文的讨论范围。 我们建议使用以下资源:

  • 有关元字符的完整列表,请参阅MDN Web文档中的正则表达式
  • 有关如何创建正则表达式的教程,我们建议RegexOne
  • 若要试验正则表达式,我们建议使用正则表达式101网站。 在左侧面板中选择ECMAScript (JavaScript) FLAVOR。
模式

输入正则表达式模式。

示例: [+-]?(\d+(\.\d+)?|\.\d+)([eE][+-]?\d+)?提取所提供文本中的所有数字。

注意:

模式应至少包含一个位于括号()中的捕获组。 如果模式不包含任何捕获组,则输出包为空。

全局匹配
启用此选项以检索文本中的所有匹配项。 每个匹配项都在单独的捆绑包中输出。 如果禁用此选项,则模块将仅检索第一个条目。
区分大小写
启用此选项可让此模块将文本视为区分大小写。
Multiline
启用此选项可确保开始和结束元字符(^$)匹配每行的开始或结束,而不只是整个输入字符串的开始或结束。
单行
启用此选项以确保句点(.) 匹配换行符(\n)。
即使模块未返回任何结果,仍继续执行路由
启用此选项以确保模块在未返回任何结果时不会停止场景。
Text
输入或映射要与模式匹配的文本。

替换

在输入的文本中搜索指定的值或正则表达式,并将结果替换为新的值。

模式
输入搜索词。 您也可以使用正则表达式。 有关正则表达式的更多详细信息,请参阅匹配模式模块。
新值
输入替换搜索词的值。
全局匹配
启用此选项以检索文本中的所有匹配项。 每个匹配项都在单独的捆绑包中输出。 如果禁用此选项,则模块将仅检索第一个条目。
区分大小写
启用此选项可让此模块将文本视为区分大小写。
Multiline
启用此选项可确保开始和结束元字符(^$)匹配每行的开始或结束,而不只是整个输入字符串的开始或结束。
单行
启用此选项以确保句点(.) 匹配换行符(\n)。
Text
输入要搜索的文本。

数据擦除

数据抓取(有时称为网页抓取、数据提取或网页收集)是从网站收集数据,并将其存储在本地数据库或电子表格中的过程。 如果要从网站中刮取数据,并且不熟悉正则表达式,则可以使用数据刮取工具。

如果数据抓取工具提供REST API,则可以通过我们的通用HTTP模块Webhooks模块连接到该工具。

recommendation-more-help
5f00cc6b-2202-40d6-bcd0-3ee0c2316b43