토큰화

중요

Data Workbench에 대해 자세히 보기 사용 종료 공지.

토큰화 변환은 입력 문자열에 대해 정규 표현식을 반복적으로 적용합니다.

하지만, RETransform, Tokenize 는 전체 문자열과 일치하지 않아도 됩니다. 에 사용되는 정규 표현식 Tokenize 변환은 입력의 하위 집합과 일치할 수 있습니다. 성냥이 발견되면, Tokenize 마지막 일치 항목이 끝난 후 문자부터 시작하여 정규 표현식을 다시 적용합니다.

매개 변수 설명 기본값
이름 변환의 설명 이름입니다. 여기에 이름을 입력할 수 있습니다.
대/소문자 구분 True 또는 False입니다. 대/소문자를 구분하는지 여부를 지정합니다.
댓글 선택 사항. 변환에 대한 참고 사항.
조건 이 변환이 적용되는 조건입니다.
기본값 조건이 충족되고 입력 값을 사용할 수 없거나 정규 표현식이 입력 값과 일치하지 않는 경우 사용할 기본값입니다.
표현식 일치에 사용되는 정규 표현식입니다.
출력 출력 문자열의 이름입니다. 주어진 입력 문자열에 대해 여러 출력을 가질 수 있습니다. 출력 수는 정규 표현식에서 캡처 하위 패턴 수에 해당해야 합니다.

다음 예에서 Tokenize 변환에서는 정규 표현식을 사용하여 쿼리 문자열(cs-uri-query에서)의 이름을 캡처하고 캡처된 하위 패턴(쿼리 이름)을 x-pull-query-name으로 출력합니다.

쿼리 문자열 "a=b&c=d"의 경우 출력은 "a"와 "c"를 포함하는 벡터가 됩니다.

정규 표현식에 대한 자세한 내용은 정규 표현식.

이 페이지에서는