Adobe Analytics 데이터와 CJA 데이터 비교

조직에서 CJA를 채택함에 따라 Adobe Analytics와 CJA 간의 데이터 차이가 있을 수 있습니다. 이는 정상이며 여러 가지 이유로 발생할 수 있습니다. CJA는 AA에서의 데이터에 대한 몇 가지 제한 사항을 개선할 수 있도록 설계되었습니다. 그러나 예기치 않은/의도하지 않은 불일치가 발생할 수 있습니다. 이 문서는 귀하와 귀하의 팀이 데이터 무결성에 대한 우려로 방해받지 않고 CJA를 사용할 수 있도록 이러한 차이점을 진단하고 해결하는 데 도움이 되도록 설계되었습니다.

Analytics 소스 커넥터를 통해 Adobe Analytics 데이터를 AEP로 가져온 다음 이 데이터 세트를 사용하여 CJA 연결을 만들었다고 가정합니다.

데이터 흐름

그런 다음 데이터 보기를 생성하고 CJA에서 이 데이터를 보고하는 동안 Adobe Analytics의 보고 결과와 불일치하는 것을 발견했습니다.

다음은 원래 Adobe Analytics 데이터와 현재 Customer Journey Analytics의 Adobe Analytics 데이터를 비교하기 위해 따라야 할 몇 가지 단계입니다.

사전 요구 사항

  • AEP의 Analytics 데이터 세트에 조사 중인 날짜 범위에 대한 데이터가 포함되어 있는지 확인합니다.

  • Analytics에서 선택한 보고서 세트가 Adobe Experience Platform에 포함된 보고서 세트와 일치하는지 확인합니다.

1단계: Adobe Analytics에서 발생 횟수 지표 실행

발생 횟수 지표는 지정된 차원이 설정되거나 지속된 히트 수를 보여 줍니다.

  1. Analytics > 작업 영역에서 차원으로 보고할 날짜 범위를 자유 형식 테이블로 끌어옵니다.

  2. 발생 횟수 지표는 해당 날짜 범위에 자동으로 적용됩니다.

  3. 비교에 사용할 수 있도록 이 프로젝트를 저장합니다.

2단계: 결과를 CJA의 타임스탬프별 총 레코드와 비교

이제 Analytics의 발생 횟수를 Customer Journey Analytics의 타임스탬프별 총 레코드와 비교합니다.

Analytics 소스 커넥터에 의해 삭제된 레코드가 없는 경우 타임스탬프별 총 레코드는 발생 횟수와 일치해야 합니다. 아래 섹션을 참조하십시오.

노트

이는 (크로스 채널 분석을 통해) 결합된 데이터 세트가 아닌 일반 평균 값 데이터 세트에만 적용됩니다. CJA에서 사용 중인 개인 ID에 대한 처리는 비교 작업을 수행하는 데 있어 매우 중요합니다. 특히 크로스 채널 분석이 켜져 있는 경우 AA에서 복제하기가 항상 쉽지는 않을 수 있습니다.

  1. Adobe Experience Platform 쿼리 서비스에서 다음 타임스탬프별 총 레코드 쿼리를 실행합니다.
SELECT Substring(from_utc_timestamp(timestamp,'{timeZone}'), 1, 10) as Day, \
        Count(_id) AS Records
        FROM  {dataset} \
        WHERE timestamp>=from_utc_timestamp('{fromDate}','UTC') \
        AND timestamp<from_utc_timestamp('{toDate}','UTC') \
        AND timestamp IS NOT NULL \
        AND enduserids._experience.aaid.id IS NOT NULL  \
        GROUP BY Day \
        ORDER BY Day;
  1. Analytics 데이터 피드에서 일부 행이 Analytics 소스 커넥터에 의해 삭제되었는지 여부를 원시 데이터에서 식별합니다.

    XDM 스키마로 변환하는 동안 Analytics 소스 커넥터가 행을 삭제할 수 있습니다. 전체 행이 변환에 적합하지 않은 이유는 여러 가지가 있을 수 있습니다. 다음 Analytics 필드 중 하나라도 이러한 값이 포함된 경우 전체 행이 삭제됩니다.

    Analytics 필드 값을 삭제하는 원인이 되는 값
    Opt_out y, Y
    In_data_only 0이 아님
    Exclude_hit 0이 아님
    Bot_id 0이 아님
    Hit_source 0,3,5,7,8,9,10
    Page_event 53,63
  2. 커넥터가 행을 삭제한 경우 발생 횟수 지표에서 해당 행을 뺍니다. 결과 숫자는 Adobe Experience Platform 데이터 세트의 이벤트 수와 일치해야 합니다.

AEP에서 수집하는 동안 레코드가 삭제되거나 건너뛸 수 있는 이유

CJA 연결을 사용하면 데이터 세트 간 공통 개인 ID를 기반으로 여러 데이터 세트를 가져오고 결합할 수 있습니다. 백엔드에서 중복 제거를 적용합니다. 타임스탬프를 기반으로 이벤트 데이터 세트에 대한 전체 외부 연결 또는 합을 적용한 다음 개인 ID를 기반으로 프로필 및 조회 데이터 세트에 대한 내부 연결을 적용합니다.

다음은 AEP에서 데이터를 수집하는 동안 레코드를 건너뛸 수 있는 몇 가지 이유입니다.

  • 타임스탬프 누락 – 이벤트 데이터 세트에서 타임스탬프가 누락된 경우 해당 레코드는 수집 중에 완전히 무시되거나 건너뜁니다.

  • 개인 ID 누락 – (이벤트 데이터세트 및/또는 프로필/조회 데이터세트에서) 누락된 개인 ID로 인해 해당 레코드가 무시되거나 건너뜁니다. 그 이유는 레코드를 연결할 공통 ID나 일치하는 키가 없기 때문입니다.

  • 유효하지 않거나 큰 개인 ID – 잘못된 ID를 사용하면 시스템이 연결할 데이터 세트 중에서 유효한 공통 ID를 찾을 수 없습니다. 경우에 따라 개인 ID 열에 “정의되지 않음” 또는 “00000000”과 같은 잘못된 개인 ID가 있습니다. 한 달에 1백만 번 이상 이벤트에 나타나는 개인 ID(숫자와 문자의 조합 포함)는 특정 사용자 또는 개인에게 할당할 수 없습니다. 잘못된 것으로 분류됩니다. 이러한 레코드는 시스템으로 수집될 수 없으며 오류 유발 수집 및 보고를 초래할 수 있습니다.

이 페이지에서는