파생 데이터 세트

파생된 데이터 세트 기능을 사용하면 데이터 레이크에서 사용할 수 있는 다른 정보에서 원하는 데이터 세트를 생성할 수 있습니다. 이러한 데이터 세트는 정기적으로 새로 고치고 필요에 따라 실시간 고객 프로필 데이터에 게시할 수 있습니다. 파생 데이터 세트는 최대, 개수 및 평균과 같은 간단한 데이터 세트보다 십분위수, 백분위수 및 사분위수와 같은 복잡한 데이터 세트를 구축해야 하는 문제를 해결합니다. 이러한 데이터 세트는 특히 개별 사용자 또는 비즈니스 엔티티에 대해 계산할 수 있습니다. 이를 통해 이메일 주소, 장치 ID 및 전화번호와 같은 식별자에 직접 액세스할 수 있는 데이터 세트를 파생하고 해당 사용자 또는 비즈니스 프로필과 간접적으로 연결된 데이터 세트를 파생할 수도 있습니다.

파생된 데이터 세트는 데이터 레이크에서 데이터를 분석할 때 다양한 사용 사례에 필요합니다. 그런 다음 실시간 고객 프로필에서 사용하도록 이 데이터를 표시할 수 있으며 집중도가 높은 대상 생성과 같은 다운스트림 사용 사례에 사용할 수 있습니다. 이 기능에 대한 몇 가지 잠재적 사용 사례는 다음과 같습니다.

  • 채널별 시청률을 기준으로 가입자의 하위 10%를 파악한다. 이렇게 하면 마케터가 특정 대상자를 타겟팅하고 새 구독자 패키지를 판매할 수 있습니다.
  • 여행한 총 마일을 기준으로 전단의 상위 10%에 있고 "전단지" 상태인 대상자를 식별합니다. 이 대상자는 새 신용카드 오퍼의 판매를 선택적으로 타겟팅하는 데 사용할 수 있습니다.
  • 구독을 기반으로 이탈률을 결정합니다.
  • 지방 또는 주에서 가구 소득의 상위 1%를 식별하고, 지난 "n"개월 동안 해당 집단 그룹에서 이탈한 개인의 수를 측정합니다.

복잡한 파생 데이터 세트

특정 차원(범주)에 대한 하나 이상의 지표(예: 수입, 시청률 기간 등)를 기반으로 등급을 만들려면 복잡한 파생 데이터 세트가 필요합니다. 십분위수, 사분위수 및 백분위수는 파생된 데이터 세트로 데이터의 등급을 지정할 때 유연성과 정밀성을 제공합니다.

십분위수는 등급이 매겨진 일련의 데이터를 10개의 동일한 부분으로 분할하는 방법입니다. 데이터를 10분위로 나누면, 데이터 세트의 각 행에 10분위수 등급이 할당된다. 이렇게 하면 데이터를 내림차순 또는 오름차순으로 정렬할 수 있습니다.

십분위수 등급은 데이터를 가장 낮은 순서에서 가장 높은 순으로 정렬하며 1에서 10까지의 척도로 수행되며, 여기서 각 연속 숫자는 10% 포인트 증가에 해당합니다.

십분위수 버킷은 등급 그룹의 수를 나타내며 데이터 세트의 차원(카테고리)에 등급을 할당하는 데 사용됩니다. 버킷은 각 파티션에 대해 양의 정수 값으로 계산되는 숫자 또는 표현식일 수 있습니다. 버킷에는 null 값이 없어야 합니다.

사분위수는 분포를 4로 나누고 백분위수는 100으로 나누는 데 사용된다.

분석 파생 데이터 세트

Query Service는 세션화, 마지막 터치 등과 같은 내장된 기능을 제공하며 모든 시계열 데이터에 적용하여 비즈니스 관련 파생 데이터 세트를 생성할 수 있습니다. 이러한 분석 파생 데이터 세트를 하나 이상의 ID에 기준으로 하고 필요한 경우 실시간 고객 프로필에 데이터를 선택적으로 게시할 수 있는 옵션이 있습니다.

이 유형의 파생된 속성에 대한 몇 가지 잠재적인 사용 사례는 다음과 같습니다.

  • 사용자 세션 중에 스캔한 제품 중 품절된 제품을 추적합니다.
  • 검색되거나 구매되는 제품의 크기, 색상 또는 제품 범주와 같이 인기 있는 지표를 추적합니다.
  • 제품 검색 또는 구매로 이어진 플랫폼 소스 추적.
  • ID로 가장 최근에 검색한 항목을 추적합니다.
  • 평균 장바구니 항목 수, 장바구니 포기 또는 평균 구매 빈도와 같은 추적 지표.

기타 파생 데이터 세트

비즈니스 지표를 파생 속성으로 계산하고 이것을 우편번호와 같은 단순 데이터 세트 또는 총 카운트와 같은 집계된 지표와 함께 사용할 수도 있습니다. 예를 들어 시/도를 기반으로 한 총 계산 또는 비즈니스 범주 및 시/도를 기반으로 한 총 계산입니다.

다음 단계 및 사용 사례

이 문서를 읽으면 쿼리 서비스에서 파생된 데이터 세트를 통해 데이터의 효용을 극대화하는 복잡한 사용 사례를 어떻게 용이하게 하는지 더 잘 이해할 수 있습니다. 다음 단계에서는 다음을 읽어야 합니다. 십분위수 기반 파생 특성 사용 사례 이 기능이 실제 시나리오에서 어떻게 적용되는지 알아봅니다.

recommendation-more-help
ccf2b369-4031-483f-af63-a93b5ae5e3fb