Data Workbench 提供終了のお知らせ.
REMatch 変換は、入力データから検索して捕捉する 1 つまたは複数のパターンを正規表現で指定するパターンマッチング変換です。
この変換では、正規表現で捕捉するサブパターンごとに出力フィールドが構築されます。正規表現が入力フィールドと一致しない場合、出力結果はブランクとなります。出力フィールドが既に存在する場合、その値がブランク値で置き換えられます。正規表現の簡単な使用法については、 正規表現.
この REMatch 変換は、 RETransform 変換 ( RETransform) を呼び出します。この関数は、正規表現を使用して文字列を取得し、その文字列を単一の出力フィールドに格納します。
REMatch 複数の文字列よりも効率的に文字列を解析する RETransform 変換または単一の RETransform その後に Flatten 変換。 詳しくは、 Flatten.
パラメーター | 説明 | デフォルト |
---|---|---|
名前 | 変換のわかりやすい名前。ここには任意の名前を入力することができます。 | |
Case Sensitive | true または false。マッチングで大文字と小文字を区別するかどうかを指定します。 | |
コメント | (オプション)。変換についてのメモ。 | |
条件 | この変換が適用される条件。 | |
式 | マッチングに使用する正規表現。 | |
Input | 正規表現に照らして評価されるフィールド。 | |
Outputs | 出力文字列または出力ベクトルの名前。入力として文字列ベクトルを受け取った場合、出力も文字列ベクトルになります。 正規表現で捕捉するサブパターンごとに出力フィールドが存在している必要があります。 |
REMatch 変換は非常に遅くなる可能性があり、データ処理時間の大部分を占める場合があります。
次の例では、YYYY-MM-DD 形式の日付を REMatch 変換で解析し、x-year、x-month、x-day の各フィールドに格納しています。2007-01-02 という日付の場合、x-year、x-month、x-day に格納される値は、それぞれ 2007、01、02 となります。