阅读有关Data Workbench 生命周期终止公告.
REMatch 转换是一种模式匹配转换,该转换使用正则表达式指定一个或多个要在输入中查找和捕获的模式。
该转换为正则表达式中的每个捕获子模式构建一个输出字段。如果正则表达式不匹配输入字段,则输出将为空;如果输出字段已经存在,则值会替换为空值。有关使用正则表达式的简要指南,请参阅 正则表达式.
的 REMatch 转换的操作方式与 RETransform 转换(请参阅 RETransform),后者使用正则表达式捕获字符串并将该字符串存储在单个输出字段中。
REMatch 比多个字符串更有效地解析字符串 RETransform 转换或单个 RETransform 转换后跟 Flatten 转换。 请参阅 Flatten.
参数 | 描述 | 默认 |
---|---|---|
名称 | 转换的描述性名称。可以在此处输入任何名称。 | |
Case Sensitive(区分大小写) | true 或 false。指定匹配是否区分大小写。 | |
评论 | 可选。有关转换的说明。 | |
条件 | 应用此转换的条件。 | |
表达式 | 用于匹配的正则表达式。 | |
Input(输入) | 计算正则表达式所针对的字段。 | |
Outputs(输出) | 输出字符串或矢量的名称。如果字符串矢量作为输入,输出也将是字符串矢量。 表达式中的每个捕获子模式必须具有一个输出字段。 |
REMatch 转换可能会非常慢,并且可能会占用大量数据处理时间。
在此示例中,REMatch 转换将 YYYY-MM-DD 格式的日期解析为字段 x-year、x-month 和 x-day。对于日期 2007-01-02,x-year、x-month 和 x-day 的值将分别是 2007、01 和 02。