Data Workbench 提供終了のお知らせ.
RETransform(正規表現)変換は、入力データから検索して捕捉するパターンを正規表現で記述し、指定された出力フィールドに捕捉した文字列を格納するパターンマッチング変換です。
正規表現の評価は、入力文字列全体に対して行われます。正規表現で指定されたパターンと入力が一致しない場合、データは捕捉されません。正規表現の簡単な使用法については、 正規表現.
この RETransform 変換は、 REMatch 変換 ( REMatch) を呼び出し、正規表現で取得するサブパターンごとに出力フィールドを作成します。 以下を考えてみてください。 RETransform 組み合わせとして REMatch および Format 変換 Action パラメーター(以下の表の「Action」を参照)が「RESULTS」に設定されている場合、RETransform は、REMatch 変換と Union 変換を組み合わせたような動作になります。
パラメーター | 説明 | デフォルト |
---|---|---|
名前 | 変換のわかりやすい名前。ここには任意の名前を入力することができます。 | |
コメント | (オプション)。変換についてのメモ。 | |
条件 | この変換が適用される条件。 | |
デフォルト | デフォルト値。条件が満たされたが、入力値が利用できない場合、または正規表現が入力値と一致しない場合に使用されます。 | |
アクション | 結果の処理方法を指定します。デフォルトの設定(RESULTS)では単に、マッチングで抽出されたパターンから文字列のベクトルが作成されます。 また、書式設定文字列をアクションとして指定することもできます。特定の形式の単純な文字列出力を作成することが可能です。この方法では、一致した各パターンの位置に対応する番号を % 記号で囲んで指定します。例えば、一致した最初のパターンは %1% に、3 番目のパターンは %3% になります。それ以外の文字は、書式設定文字列の中でリテラルに指定します。 |
RESULTS |
式 | マッチングに使用する正規表現。 | |
Input | 正規表現に照らして評価されるフィールド。 | |
出力 | 出力文字列の名前。 |
RETransform 変換は非常に遅くなる可能性があり、データ処理時間の大部分を占める場合があります。
次の例では、Web サイトの訪問者が使用している Windows オペレーティングシステムのバージョンを抽出し、その値から x-windows-version フィールドを作成します。このケースでは、バージョン番号だけが出力値として得られます。
読みやすくするために、バージョン番号の前に「Version」という文字列を追加したい場合は、Action パラメーターを「RESULTS」から「Version %1%」に変更します。リテラルのパーセント記号(%)を出力に含めるには、「%%」のように、パーセント記号をもう 1 つ追加してエスケープします。