Data Workbench에 대해 자세히 보기 사용 종료 공지.
토큰화 변환은 입력 문자열에 대해 정규 표현식을 반복적으로 적용합니다.
하지만, RETransform, Tokenize 는 전체 문자열과 일치하지 않아도 됩니다. 에 사용되는 정규 표현식 Tokenize 변환은 입력의 하위 집합과 일치할 수 있습니다. 성냥이 발견되면, Tokenize 마지막 일치 항목이 끝난 후 문자부터 시작하여 정규 표현식을 다시 적용합니다.
매개 변수 | 설명 | 기본값 |
---|---|---|
이름 | 변환의 설명 이름입니다. 여기에 이름을 입력할 수 있습니다. | |
대/소문자 구분 | True 또는 False입니다. 대/소문자를 구분하는지 여부를 지정합니다. | |
댓글 | 선택 사항. 변환에 대한 참고 사항. | |
조건 | 이 변환이 적용되는 조건입니다. | |
기본값 | 조건이 충족되고 입력 값을 사용할 수 없거나 정규 표현식이 입력 값과 일치하지 않는 경우 사용할 기본값입니다. | |
표현식 | 일치에 사용되는 정규 표현식입니다. | |
출력 | 출력 문자열의 이름입니다. 주어진 입력 문자열에 대해 여러 출력을 가질 수 있습니다. 출력 수는 정규 표현식에서 캡처 하위 패턴 수에 해당해야 합니다. |
다음 예에서 Tokenize 변환에서는 정규 표현식을 사용하여 쿼리 문자열(cs-uri-query에서)의 이름을 캡처하고 캡처된 하위 패턴(쿼리 이름)을 x-pull-query-name으로 출력합니다.
쿼리 문자열 "a=b&c=d"의 경우 출력은 "a"와 "c"를 포함하는 벡터가 됩니다.
정규 표현식에 대한 자세한 내용은 정규 표현식.