RETransform

最終更新日: 2022-10-05
  • 作成対象:
  • User
    Admin
重要

Data Workbench 提供終了のお知らせ.

RETransform(正規表現)変換は、入力データから検索して捕捉するパターンを正規表現で記述し、指定された出力フィールドに捕捉した文字列を格納するパターンマッチング変換です。

正規表現の評価は、入力文字列全体に対して行われます。正規表現で指定されたパターンと入力が一致しない場合、データは捕捉されません。正規表現の簡単な使用法については、 正規表現.

メモ

この RETransform 変換は、 REMatch 変換 ( REMatch) を呼び出し、正規表現で取得するサブパターンごとに出力フィールドを作成します。 以下を考えてみてください。 RETransform 組み合わせとして REMatch および Format 変換 Action パラメーター(以下の表の「Action」を参照)が「RESULTS」に設定されている場合、RETransform は、REMatch 変換と Union 変換を組み合わせたような動作になります。

パラメーター 説明 デフォルト
名前 変換のわかりやすい名前。ここには任意の名前を入力することができます。
コメント (オプション)。変換についてのメモ。
条件 この変換が適用される条件。
デフォルト デフォルト値。条件が満たされたが、入力値が利用できない場合、または正規表現が入力値と一致しない場合に使用されます。
アクション

結果の処理方法を指定します。デフォルトの設定(RESULTS)では単に、マッチングで抽出されたパターンから文字列のベクトルが作成されます。

また、書式設定文字列をアクションとして指定することもできます。特定の形式の単純な文字列出力を作成することが可能です。この方法では、一致した各パターンの位置に対応する番号を % 記号で囲んで指定します。例えば、一致した最初のパターンは %1% に、3 番目のパターンは %3% になります。それ以外の文字は、書式設定文字列の中でリテラルに指定します。

RESULTS
マッチングに使用する正規表現。
Input 正規表現に照らして評価されるフィールド。
出力 出力文字列の名前。
メモ

RETransform 変換は非常に遅くなる可能性があり、データ処理時間の大部分を占める場合があります。

次の例では、Web サイトの訪問者が使用している Windows オペレーティングシステムのバージョンを抽出し、その値から x-windows-version フィールドを作成します。このケースでは、バージョン番号だけが出力値として得られます。

読みやすくするために、バージョン番号の前に「Version」という文字列を追加したい場合は、Action パラメーターを「RESULTS」から「Version %1%」に変更します。リテラルのパーセント記号(%)を出力に含めるには、「%%」のように、パーセント記号をもう 1 つ追加してエスケープします。

このページ