교차 행

다른 변형처럼 교차 행 변환이 로그 소스의 데이터 행(로그 항목)에 적용됩니다.

각 데이터 행에 대해 변환은 지정된 입력 필드의 값을 가져오고, 처리 단계 집합을 수행하고, 지정한 출력 필드에 결과를 기록합니다. 그러나 CrossRows 변형이 하나의 데이터 행에서 작동하는 경우(이 행을 출력 행이라고 함) 해당 행과 동일한 추적 ID와 연결된 하나 이상의 다른 데이터 행(이러한 행을 입력 행이라고 함)을 고려합니다. 따라서, 주어진 추적 ID의 경우, 각 출력 행에 대한 출력 필드의 값은 하나 이상의 입력 행에 대한 입력 필드의 값을 기반으로 한다.

변환에서는 변환에 대한 입력 행을 제한할 수 있는 여러 조건과 제약 조건을 제공합니다. Data Workbench 서버의 조건( 조건 참조), 출력 행에 대한 입력 행 범위 또는 출력 행의 시간에 대한 상대적 시간의 범위에서 이러한 제한을 표시할 수 있습니다. 변환의 조건 및 제약 조건을 만족하는 입력 행의 경우 출력 필드의 값을 결정하는 작업(예: SUM)을 적용할 수 있습니다.

노트

작동하려면 CrossRows 변형을 사용하려면 데이터가 제시간에 정렬되어 소스 데이터의 추적 ID별로 그룹화되어야 합니다. 따라서 CrossRows은 Transformation.cfg 파일 또는 Transformation Dataset Include 파일에 정의된 경우에만 작동합니다.

다음 테이블에서 매개변수 설명을 검토할 때 다음 사항을 기억하십시오.

  • 출력 행은 특정 시점에 변환에서 작동하는 데이터의 행입니다.
  • 입력 행은 입력 필드의 값이 변환에 대한 입력으로 사용되는 다른 데이터 행(출력 행 전, 후 또는 포함)입니다. 입력 행에는 입력 조건, 키, 행 시작, 행 종료, 시간 시작 및 시간 종료 매개 변수가 적용됩니다.
매개 변수 설명 기본값
이름 변환의 설명 이름입니다. 여기에 이름을 입력할 수 있습니다.
댓글 선택 사항입니다. 변환에 대한 참고 사항.
조건 변환 출력을 특정 로그 항목으로 제한합니다. 특정 로그 항목에 대해 조건이 충족되지 않으면 출력 매개 변수의 필드는 변경되지 않은 상태로 유지됩니다. 입력은 다른 로그 항목에 영향을 주는 데 사용할 수 있습니다.
입력 입력으로 사용할 입력 행의 필드 이름입니다.
입력 조건 특정 입력 행에서만 변형을 위한 입력을 허용합니다. 특정 입력 행에 대해 입력 조건이 충족되지 않으면 해당 행의 입력 필드가 무시되며 다른 출력 행에 영향을 주지 않습니다. 그러나 해당 행의 출력 필드는 지정된 조건에 따라 계속 수정됩니다.

선택 사항입니다. 키로 사용할 필드의 이름입니다.

키를 지정하면, 지정된 출력 행의 입력 행은 출력 행과 동일한 키 값을 갖는 행의 연속 블록으로 제한됩니다. 이 제한 사항은 CrossRows 변환의 다른 매개 변수로 입력 행에 배치된 다른 모든 제한 사항 외에 있습니다.

예를 들어, 웹 데이터를 사용하여 작업하는 경우 필드 x-session-key(각 세션에 대한 고유한 값이 있음)를 키에 지정하는 경우 변환의 입력 행은 출력 행과 동일한 x-session-key 값을 갖는 행으로 제한됩니다. 따라서 출력 행과 동일한 세션 중에 발생하는 페이지 보기를 나타내는 입력 행만 고려합니다.

작업

각 출력 행에 대해 입력 조건, 키, 행 시작, 행 끝, 시간 시작 및 시간 종료 매개변수에 정의된 모든 조건을 충족하는 모든 입력 행에 적용된 작업을 통해 출력을 생성합니다.

  • ALL은 입력 행에서 입력 필드의 모든 값을 가져와 벡터로 출력합니다.
  • SUM은 입력 행으로부터 입력 필드의 값을 숫자로 해석하여 합합니다.
  • 첫 번째 행은 첫 번째 입력 행에서 입력 필드의 값을 출력합니다.
  • 마지막 행 은 마지막 입력 행에서 입력 필드의 값을 출력합니다.

출력 출력 필드의 이름입니다.
행 시작/행 끝

선택 사항입니다. 출력 행에 상대적인 입력 행 범위를 지정합니다. 예를 들어, 행 시작 값 "0"은 출력 행 앞에 있는 모든 행을 제외합니다. 행 시작 값 "1"은 출력 행도 제외합니다. 일반적인 범위는 다음과 같습니다.

  • 시작 0:이 행 및 그 이후의 모든 행.
  • 시작 1:모든 후속 행.
  • 종료 0:이 행 및 모든 이전 행.
  • 종료 -1:모든 이전 행.
  • 시작 -1, 끝 -1:이전 행입니다.
  • 1, 1 종료:다음 행.

모든 행
시간 시작/시간 종료

선택 사항입니다. 출력 행의 시간을 기준으로 하는 시간 범위를 지정합니다. 예를 들어 30분의 시간 종료에는 출력 행 후 30분 이내에 발생하는 모든 행이 포함됩니다. -30분의 시간 시작에는 출력 행 30분 이내에 발생하는 모든 행이 포함됩니다.

사용 가능한 시간 단위는 일, 주, 시간, 분, 밀리초, 틱(100나노초) 및 ns(나노초)입니다.

항상

이 예제의 CrossRows 변환은 다음 페이지 보기 시간을 기준으로 각 페이지 보기에 대해 찾기 위해 웹 데이터 행에 적용됩니다. CrossRows은 데이터 집합 구성 프로세스의 변형 단계 동안에만 적용된다는 것을 알고 있으므로 데이터 행의 순서가 방문자(각 방문자는 고유한 추적 ID를 가지고 있음)와 시간으로 지정됩니다.

x-timestamp 입력 필드는 x-is-page-view 필드가 채워지는 입력 행에만 고려됩니다(데이터 행이 페이지 보기를 나타내는지 표시). Key 매개 변수에 대해 x-session-key 필드(각 세션에 대한 고유한 값)가 지정됩니다. 따라서, 변환을 위한 입력 행(로그 항목)은 출력 행과 동일한 값을 갖는 행의 연속 블록으로 제한됩니다. 즉, 변환에 대해 고려하려면 입력 행이 출력 행의 페이지 보기와 동일한 세션 중에 발생하는 페이지 보기를 나타내야 합니다. 첫 번째 행 작업은 Input 조건을 만족하고 출력 행과 동일한 x-session-key 값을 갖는 첫 번째 입력 행에서 출력 필드의 값을 가져옵니다.

CrossRows 은 입력 크기와 출력 크기에 비례하는 시간을 실행합니다. 즉, SUM, FIRST ROW 및 LAST ROW 작업의 경우 다른 변형보다 효율적이지 않습니다. ALL의 경우 지정된 추적 ID에 대한 총 행(로그 항목)에 비례하는 각 데이터 행(로그 항목)에 대한 데이터 양을 출력하도록 CrossRows을 구성할 수 있으므로 상황이 더 복잡합니다.

이 페이지에서는