REMatch 変換は、入力データから検索して捕捉する 1 つまたは複数のパターンを正規表現で指定するパターンマッチング変換です。
この変換では、正規表現で捕捉するサブパターンごとに出力フィールドが構築されます。正規表現が入力フィールドと一致しない場合、出力結果はブランクとなります。出力フィールドが既に存在する場合、その値がブランク値で置き換えられます。正規表現の簡単な使用法については、 正規表現.
この変 REMatch 換の動作は、変換と同 RETransform 様です( RETransformを参照)。この変換では、正規表現を使用して文字列を取り込み、その文字列を単一の出力フィールドに格納します。
REMatch 複数の変換や1つの変換の後に変換が続く RETransform よりも効率的に RETransform 文字列を解析でき Flatten ます。 分割・統合を参 照してください。
パラメーター | 説明 | デフォルト |
---|---|---|
名前 | 変換のわかりやすい名前。ここには任意の名前を入力することができます。 | |
Case Sensitive | true または false。マッチングで大文字と小文字を区別するかどうかを指定します。 | |
Comments | (オプション)変換についてのメモ。 | |
Condition | この変換が適用される条件。 | |
式 | マッチングに使用する正規表現。 | |
Input | 正規表現に照らして評価されるフィールド。 | |
Outputs | 出力文字列または出力ベクトルの名前。入力として文字列ベクトルを受け取った場合、出力も文字列ベクトルになります。 正規表現で捕捉するサブパターンごとに出力フィールドが存在している必要があります。 |
REMatch 変換は非常に遅くなり、データの処理時間の大部分を占める場合があります。
次の例では、YYYY-MM-DD 形式の日付を REMatch 変換で解析し、x-year、x-month、x-day の各フィールドに格納しています。2007-01-02 という日付の場合、x-year、x-month、x-day に格納される値は、それぞれ 2007、01、02 となります。