데이터 준비 및 수집 블루프린트

마지막 업데이트: 2023-12-08
  • 작성 대상:
  • Developer
    User

데이터 준비 및 수집 블루프린트는 데이터를 준비하고 Adobe Experience Platform으로 수집하는 방법을 모두 포함합니다.

데이터를 준비할 때는 소스 데이터를 XDM(Experience Data Model) 스키마로 매핑하게 됩니다. 또한 데이터에 날짜 포맷 정리, 필드 분할/연결/전환 및 기록 연결/병합/재입력 등의 변환을 수행합니다. 데이터 준비를 통해 고객 데이터를 단일화하면 종합적이고 필터링된 분석 제공에 도움이 됩니다. 보고 시에나 고객 프로필 집합/데이터 과학/활성화 등을 위해 데이터를 준비할 때 유용합니다.

아키텍처

데이터 준비 및 수집 블루프린트의 참조 아키텍처

데이터 수집 가드레일

아래 다이어그램은 Adobe Experience Platform에 데이터를 수집할 때의 평균 성능 가드레일과 지연 시간을 보여줍니다.

Experience Platform 데이터 흐름

데이터 수집 방법

스트리밍 소스

방법

일반적인 사용 사례

프로토콜

고려할 사항

Adobe Web/Mobile SDK

  • 웹 사이트 및 모바일 앱에서의 데이터 수집.
  • 클라이언트 측 수집 시 우선으로 쓰는 방법.

푸시, HTTP, JSON

  • 단일 SDK를 활용하여 여러 Adobe 애플리케이션을 구현.

HTTP API 커넥터

  • 스트리밍 소스, 트랜잭션, 관련 고객 이벤트 및 신호에서의 수집

푸시, REST API, JSON

  • 데이터가 허브로 직접 스트리밍되므로 실시간 Edge 세분화나 이벤트 전달을 구현할 수 없음.

Edge Network API

  • 전 세계에 분산된 Edge Network의 스트리밍 소스, 트랜잭션, 관련 고객 이벤트, 신호로부터 수집

푸시, REST API, JSON

  • 데이터가 Edge Network를 통해 스트리밍됨. Edge에서의 실시간 세분화 지원.

Adobe 애플리케이션

  • Adobe Analytics, Marketo, Campaign, Target, AAM의 사전 구현

푸시, 소스 커넥터와 API

  • 기존 애플리케이션 SDK보다는 Web/Mobile SDK로 마이그레이션하는 방법을 추천.

스트리밍 소스 커넥터

  • 기업 이벤트 스트림을 수집하며, 보통 여러 다운스트림 애플리케이션에 기업 데이터를 공유하는 데 사용.

푸시, REST API, JSON

  • XDM 포맷으로 스트리밍해야 함.

스트리밍 소스 SDK

  • HTTP API 커넥터와 마찬가지로 외부 데이터 스트림의 셀프 서비스 구성 카드 사용 가능.

푸시, HTTP API, JSON

  • Edge Network

일괄 처리 소스

방법

일반적인 사용 사례

프로토콜

고려할 사항

일괄 수집 API

  • 기업이 관리하는 대기열에서의 수집. 수집 전 데이터 정리 및 변환.

푸시, JSON 또는 Parquet

  • 수집할 배치 및 파일을 관리해야 함

일괄 처리 소스 커넥터

  • 클라우드 저장소 위치에서 파일을 수집하는 일반적인 방법.
  • 일반적인 CRM 및 마케팅 애플리케이션에 대한 커넥터.
  • 내역 데이터 대량 수집에 적합.

풀, CSV, JSON, Parquet

  • 항상 켜져 있지 않음, 즉각 수집.
  • 델타 파일 수집을 위해 최소 15분마다 빈도 확인 되풀이

데이터 랜딩 영역

  • 수집을 위해 파일을 푸시할 Adobe 프로비전 파일 스토리지 위치.

푸시, CSV, JSON, Parquet

- 파일의 TTL은 7일입니다

일괄 처리 소스 SDK

  • 외부 데이터 소스의 셀프 서비스 구성 카드 사용 가능.
  • 파트너 커넥터 또는 기업 커넥터를 설정하기 위한 맞춤형 워크플로우 경험에 적합.

풀, REST API, CSV 또는 JSON 파일

  • 최소 빈도 15분
  • 예: MailChimp, One Trust, Zendesk

 

수집 방법 설명
Web/Mobile SDK 지연:
  • 실시간 - 동일한 페이지에서 Edge Network로 수집
  • 95번째 백분위수에서 15분 미만의 프로필로 수집 스트리밍
  • 데이터 레이크로 스트리밍 수집(소규모 일괄 처리 15분 이내)
사용자 가이드:
스트리밍 소스 스트리밍 소스
지연:
  • 실시간 - 동일한 페이지에서 Edge Network로 수집
  • 프로필로 스트리밍 수집 1분 이내
  • 데이터 레이크로 스트리밍 수집(소규모 일괄 처리 15분 이내)
스트리밍 API Edge Network Server API(기본 설정) - Edge 세분화 등 Edge 서비스 지원,
Data Collection Core Service API - Edge 서비스를 지원하지 않고 허브로 직접 라우팅
지연:
  • 실시간 - 동일한 페이지에서 Edge Network로 수집
  • 프로필로 스트리밍 수집 1분 이내
  • 데이터 레이크로 스트리밍 수집(소규모 일괄 처리 15분 이내)
  • 7GB/시간
사용자 가이드
ETL 도구 사용 ETL 도구를 사용하여 엔터프라이즈 데이터를 Experience Platform으로 수집하기 전에 수정 및 변환합니다.

지연:
  • 시간은 외부 ETL 도구의 예약 설정에 따라 달라지며, 수집에 사용하는 방법을 기반으로 표준 수집 가드레일이 적용됩니다.
일괄 처리 소스 소스 예약 호출
지연: 최대 200GB/시간

설명서
비디오 튜토리얼
일괄 처리 API 지연:
  • 프로필로 일괄 수집하는 경우 규모 및 트래픽 부하에 따라 달라지며 45분 이내
  • 데이터 레이크로 일괄 수집하는 경우 규모 및 트래픽 부하에 따라 다름
사용자 가이드
Adobe 애플리케이션 커넥터 Adobe Experience Cloud 애플리케이션을 소스로 하는 데이터를 자동으로 수집

데이터 준비 방법

데이터 준비 방법 설명
외부 ETL 도구(Snaplogic, Mulesoft, Informatica 등) ETL 도구에서 복잡한 변환을 수행하고 표준 Experience Platform 플로우 서비스 API 또는 소스 커넥터를 사용하여 결과 데이터를 수집합니다.
쿼리 서비스 - 데이터 준비 데이터를 새 데이터 세트와 연결, 분할, 병합, 변환, 쿼리 및 필터링합니다. CTAS(Create Table as Selec) 사용
설명서
XDM 매핑 및 데이터 준비 함수(스트리밍 및 일괄 처리) Experience Platform 수집 시 CSV 또는 JSON 포맷의 소스 특성을 XDM 특성에 매핑합니다.
수집하는 데이터의 함수 계산(데이터 형식 지정, 분할, 연결 등)
사용자 가이드

관련 블로그 게시물

이 페이지에서는