차원 설정

이 섹션에서는 다양한 유형의 차원과 DWB에서 설정하는 방법에 대해 설명합니다.

차원이란?

가장 기본적인 수준에서 차원은 데이터 세트에 있는 데이터를 분류할 수 있는 카테고리입니다.

모범 사례:데이터 스키마의 차원은 모든 이름을 제공할 수 있습니다. 이 강좌에서 사용하고 설명한 차원 이름은 우수 사례로 간주됩니다. 차원의 이름은 다르게 지정할 수 있습니다. 다른 데이터 세트에 노출되면 데이터 세트에 차이가 생깁니다. 차원 이름이 아니라 차원의 목적을 이해하는 것이 중요합니다. 예를 들어, "방문자", "고객", "사람", "소비자" 또는 "사용자"라고 불릴지라도 단일 사람에 대한 정보를 수집하는 데 사용되는 최고 수준의 계산 가능한 차원을 참조하는 데 일반적으로 사용되는 용어임을 이해하는 것이 중요합니다.

자세한 내용은 데이터 세트 구성 안내서를 참조하십시오 .

DWB의 차원 유형

데이터 워크벤치에는 두 가지 유형의 차원이 있습니다.확장 차원 및 파생 차원.

확장 차원은 "원시" 데이터 파일의 필드에서 생성됩니다. 확장 차원은 "원시" 데이터를 분류하고 데이터 사이에 존재하는 관계를 지정하는 데 사용됩니다. 확장 차원은 Data Workbench Architects에서 만듭니다.

파생된 차원은 기존 확장 차원 정의를 사용하여 데이터 세트를 처리한 후 "클라이언트측"에 사용자가 만듭니다. 예를 들어, 기존 URI 차원을 기반으로, 사용자는 지정된 URI 대신 사용자에게 더 친숙한 페이지 이름을 표시하는 파생된 페이지 이름 차원을 만들 수 있습니다. 모든 차원은 차원을 구성하기 위해 함께 분류(그룹화)된 요소 또는 항목으로 구성됩니다. 아래에는 3개의 차원과 요소가 있습니다.

파생된 측정기준 중에는 다양한 시각화 유형을 파생시키기 위해 자동으로 생성되는 것이 많습니다. 예를 들어 사용자가 사이트나 프로세스 맵을 빌드할 때 DWB 서버는 접두사 차원을 만듭니다. 보고 시간 측정기준 등의 기타 측정기준은 프로필의 Dimensions 디렉토리에 있는 파일로 정의됩니다.

노트

주어진 차원에 나타나는 요소는 데이터 세트에 로드되도록 선택한 레코드에 있는 값만 반영합니다. 예를 들어 "May '12"에 대한 데이터가 없으면 해당 달이 'Month' 차원에 나타나지 않습니다.

Extended Dimensions

확장 차원 유형

1) 계산 가능한 차원

최상위 수준에는 계산 가능한 차원이 있습니다. 계산 가능한 차원은 두 가지 주요 기능을 제공합니다. 첫째, 계산하려는 요소의 차원입니다. 다시 말해 계산표는 다음과 같은 질문에 대한 답변을 제공합니다.

  • 홈 페이지를 방문한 방문자 수
  • "google.com에서 방문한 방문자가 몇 명입니까?"

이러한 이유로, 계산표는 지표를 만들기 위한 기본 빌딩 블록으로 종종 사용됩니다.

계산표의 두 번째 주요 기능은 데이터세트 스키마 구조의 백본을 형성한다는 것입니다. 데이터 스키마 및 기타 모든 차원은 계산 가능한 아래로 그룹화되고 여기에 속하도록 구성됩니다. 즉, 차원을 "카테고리"로 간주하는 경우 분류는 이러한 "카테고리"를 그룹으로 구성하는 방법입니다.

차원을 계산 가능한 차원으로 그룹화하면 계산 가능한 차원의 "레벨"에 있다고 합니다. 예를 들어, '이메일 주소'는 방문자 수준에 있고 "브라우저"는 방문 수준에 있을 수 있습니다. "상위" 및 "하위"는 계산 가능한 차원과 그 아래에 그룹화된 차원 사이의 관계를 의미합니다. 예를 들어 방문자는 이메일 주소의 "상위"입니다. 반대로 이메일 주소는 방문자의 "하위"입니다.

2) Simple Dimensions

모든 차원의 가장 일반적인 차원은 단순 차원입니다. 단순 차원은 상위 계산 가능한 차원과 일대다 관계를 가지며 일반적으로 시각화에서 사용되므로 해당 요소를 볼 수 있습니다. 즉, 계산 가능한 차원은 단순 차원에 대해 하나의 값을 가질 수 있지만 단순 차원은 하나 이상의 계산 테이블에 속할 수 있습니다. 예를 들어 고객의 이름이 'John'인 경우, 이 고객은 한 명의 이름만 가질 수 있지만, 다른 많은 고객은 'John;'이라는 이름을 가질 수 있습니다. 다른 예로, 웹 사이트의 특정 방문에 대해 브라우저(예: Firefox)를 하나만 사용할 수 있지만 이 브라우저는 여러 방문에 사용할 수 있습니다.

계산 가능한 차원이 "몇 개?"로 응답하면 단순 차원이 "어떤 것?"으로 응답합니다. 계산 가능한 차원 섹션에 사용된 위의 동일한 예제 사용페이지 이름은 간단한 차원입니다. 테이블과 단순 차원인 페이지 이름을 사용하여 다음과 같은 질문에 대답할 수 있습니다.

  • "페이지 보기가 가장 많은 페이지는 어디입니까?"
  • "모든 장바구니 페이지 중 가장 많은 방문 횟수를 기록한 페이지는 무엇입니까?"

3) 다대다 차원

다대다 차원은 상위 계산 가능한 차원과 다대다 관계를 가집니다. 예를 들어 외부 검색어라는 차원이 방문 수준에 있는 경우특정 외부 검색어는 하나 이상의 방문에서 사용할 수 있으며, 주어진 방문에는 하나 이상의 외부 검색어가 포함될 수 있습니다. 따라서 외부 검색어는 다대다 차원입니다.

4) 숫자 차원

숫자 차원은 숫자 값을 갖는 간단한 차원의 유형입니다. 숫자 차원은 지표에 사용하기 위해 종종 만들어집니다. 숫자 차원의 예로는 '매출액', '주문 수' 및 '판매량'이 있습니다. 위의 예에서 '고객 주문'은 숫자 차원입니다.
5) 비정상 차원 비정상 차원은 상위 계산 가능한 차원과 일대일 관계를 갖는 차원입니다. 비정상 차원은 식별 데이터와 같이 카디널리티(많은 고유 요소)가 높은 차원에 사용되는 경우가 많습니다. 예를 들어 방문자는 하나의 사용자 ID만 가질 수 있고 사용자 ID는 한 명의 방문자에게만 속할 수 있습니다. 따라서, 이것은 일 대 일 관계이고 비정상 차원이 될 수 있습니다.

예를 들어 Geometrixx 웹 사용자 ID는 고객 수준에서 비정상 차원입니다. 비정상 상태이므로 상위 차원과 일대일 관계가 있습니다. 즉, 각 웹 사용자 ID에는 하나의 고객이 있고 각 고객은 하나의 웹 사용자 ID만 있습니다. 따라서 '고객' 지표는 Geometrixx 웹 사용자 ID의 각 요소에 대해서만 '1'이 될 수 있습니다.

6) 시간 차원

시간 차원을 사용하면 지정한 타임스탬프 필드를 기반으로 주기적 또는 절대 로컬 시간 차원 집합을 만들 수 있습니다. 시간 차원의 예로는 '일', '시간', '주' 및 '시간'이 있습니다. 위의 예에서 '하루 중 시간' 테이블은 여러 시간 동안 받은 방문 및 페이지 보기 횟수를 보여줍니다.

노트

표시 서식 지정에 사용되는 % 이스케이프 처리는 표준 C 라이브러리 스트림과 동일합니다.

확장 차원 정의

확장 차원 정의 단계:

  1. 데이터 집합 프로필에서 작업하는 동안 프로필 관리자를 열고 데이터 집합을 클릭하여 내용을 표시합니다.

  2. 확장 차원을 정의할 Transformation.cfg 파일 또는 변형 데이터 세트 포함 파일을 엽니다.

  3. 변형을 마우스 오른쪽 단추로 클릭하고 새로 추가 > <Extended dimension type>을 클릭합니다.

  4. 확장 차원에 적합한 정보를 입력합니다. 변환 유형에 대한 설명과 해당 매개 변수에 대한 자세한 내용은 다음 섹션을 참조하십시오.

  5. 정의한 확장 차원의 경우, Comments 매개 변수에 하나 이상의 주석 라인을 추가하여 차원을 자세히 설명하거나 해당 사용에 대한 메모를 추가할 수 있습니다. 주석을 추가하려면 [주석] 레이블을 마우스 오른쪽 단추로 클릭하고* 새로 추가 > [주석 줄*]을 클릭합니다.

  6. 구성 파일에서 확장 차원을 정의한 후 파일을 로컬로 저장하고 DWB 서버의 데이터 세트 프로필에 저장합니다.

확장 차원 숨기기

확장 차원은 DWB의 치수 메뉴에 표시되지 않도록 숨길 수 있습니다. 차원을 숨기려면 차원 정의에서 Hidden 속성을 "True"로 설정합니다.

이 페이지에서는