UI에서 클라우드 스토리지 배치 연결에 대한 데이터 흐름 구성

데이터 흐름은 소스에서 Platform 데이터 집합으로 데이터를 검색하고 수집하는 예약된 작업입니다. 이 자습서에서는 클라우드 저장소 계정을 사용하여 새 데이터 흐름을 구성하는 단계를 제공합니다.

시작하기

이 자습서에서는 Adobe Experience Platform의 다음 구성 요소를 이해하고 있어야 합니다.

또한 이 자습서에서는 클라우드 저장소 계정이 설정되어 있어야 합니다. UI에서 다른 클라우드 스토리지 계정을 만드는 자습서 목록은 소스 커넥터 개요에 있습니다.

지원되는 파일 형식

Experience Platform 에서는 외부 저장소에서 수집할 다음 파일 형식을 지원합니다.

  • 구분 기호로 구분된 값(DSV): 모든 단일 문자 값은 DSV 형식 데이터 파일의 구분 기호로 사용할 수 있습니다.
  • JavaScript Object Notation (JSON): JSON 형식 데이터 파일은 XDM 규격 파일이어야 합니다.
  • Apache Parquet: Parquet 형식의 데이터 파일은 XDM 규격 파일이어야 합니다.
  • 압축된 파일: JSON 및 구분된 파일은 다음과 같이 압축할 수 있습니다. bzip2, gzip, deflate, zipDeflate, tarGziptar.

데이터 선택

클라우드 스토리지 계정을 만든 후 데이터 선택 단계가 나타나고 클라우드 스토리지 파일 계층 구조를 탐색할 수 있는 인터페이스를 제공합니다.

  • 인터페이스의 왼쪽 부분은 클라우드 스토리지 파일과 디렉토리를 표시하는 디렉토리 브라우저입니다.
  • 인터페이스의 오른쪽 부분에서 호환되는 파일에서 최대 100개의 데이터 행을 미리 볼 수 있습니다.

인터페이스

나열된 폴더를 선택하면 폴더 계층 구조를 더 깊은 폴더로 트래버스할 수 있습니다. 단일 폴더를 선택하여 폴더의 모든 파일을 재귀적으로 수집할 수 있습니다. 전체 폴더를 섭취할 때 폴더의 모든 파일이 동일한 스키마를 공유하는지 확인해야 합니다.

호환되는 파일 또는 폴더를 선택한 후 데이터 형식 선택 드롭다운 메뉴에서 해당 데이터 형식을 선택합니다.

다음 표에는 지원되는 파일 형식에 적절한 데이터 형식이 표시됩니다.

파일 유형 데이터 형식
CSV로 내보내기 구분 기호
JSON JSON
쪽모이 세공 XDM Parquet

JSON​을 선택하고 미리 보기 인터페이스가 완료될 때까지 몇 초 기다립니다.

select-data

노트

구분된 파일 및 JSON 파일 유형과 달리, Parquet 형식 파일은 미리 볼 수 없습니다.

미리 보기 인터페이스를 사용하면 파일의 내용 및 구조를 검사할 수 있습니다. 기본적으로 미리 보기 인터페이스에서는 선택한 폴더에 첫 번째 파일이 표시됩니다.

다른 파일을 미리 보려면 검사할 파일 이름 옆에 있는 미리 보기 아이콘을 선택합니다.

기본 미리 보기

폴더의 파일의 내용과 구조를 검사한 후 다음​을 선택하여 폴더의 모든 파일을 재귀적으로 수집할 수 있습니다.

select-folder

특정 파일을 선택하려면 수집할 파일을 선택한 다음 다음​을 선택합니다.

select-file

구분된 파일에 대한 사용자 지정 구분 기호 설정

구분된 파일을 수집할 때 사용자 지정 구분 기호를 설정할 수 있습니다. 구분 기호 옵션을 선택한 다음 드롭다운 메뉴에서 구분 기호를 선택합니다. 이 메뉴에는 쉼표(,), 탭(\t) 및 파이프(|)를 포함하여 구분 기호에 가장 자주 사용되는 옵션이 표시됩니다. 사용자 지정 구분 기호를 사용하려면 사용자 지정​을 선택하고 팝업 입력 막대에서 선택한 단일 문자 구분 기호를 입력합니다.

데이터 형식을 선택하고 구분 기호를 설정하면 다음​을 선택합니다.

압축된 파일 수집

압축 유형을 지정하여 압축 JSON 또는 구분된 파일을 수집할 수 있습니다.

데이터 선택 단계에서 수집하기 위해 압축된 파일을 선택한 다음 해당 파일 형식과 XDM 규격 여부를 선택합니다. 그런 다음 압축 유형​을 선택하고 소스 데이터에 적합한 압축 파일 유형을 선택합니다.

압축된 파일 유형이 식별되면 다음​을 선택하여 계속 진행합니다.

XDM 스키마에 데이터 필드 매핑

매핑 단계가 나타나고 소스 데이터를 Platform 데이터 세트에 매핑하기 위한 대화형 인터페이스를 제공합니다. Parquet에서 형식이 지정된 소스 파일은 XDM 규격 파일이어야 하며, 수동으로 매핑을 구성할 필요가 없습니다. 반면 CSV 파일을 사용하려면 명시적으로 매핑을 구성해야 하지만 매핑할 소스 데이터 필드를 선택할 수 있도록 하십시오. XDM 불만 사항으로 표시된 JSON 파일은 수동 구성이 필요하지 않습니다. 그러나 XDM 규격으로 표시되지 않으면 매핑을 명시적으로 구성해야 합니다.

수집할 인바운드 데이터에 대한 데이터 세트를 선택합니다. 기존 데이터 세트를 사용하거나 새 데이터 세트를 만들 수 있습니다.

기존 데이터 세트 사용

기존 데이터 세트에 데이터를 수집하려면 기존 데이터 세트​를 선택한 다음 데이터 세트 아이콘을 선택합니다.

데이터 세트 선택 대화 상자가 나타납니다. 사용할 데이터 집합을 찾은 다음 선택한 다음 계속​을 클릭합니다.

새 데이터 세트 사용

데이터를 새 데이터 세트에 수집하려면 새 데이터 세트​를 선택하고 제공된 필드에 데이터 세트에 대한 이름과 설명을 입력합니다. 스키마를 추가하려면 스키마 선택 대화 상자에 기존 스키마 이름을 입력할 수 있습니다. 또는 스키마 고급 검색​을 선택하여 적절한 스키마를 검색할 수 있습니다.

이 단계 동안 데이터 세트에 Real-time Customer Profile을(를) 활성화하고 엔티티의 속성 및 동작을 전체적으로 볼 수 있습니다. 활성화된 모든 데이터 세트의 데이터는 Profile에 포함되며 변경 사항은 데이터 흐름을 저장할 때 적용됩니다.

프로필 데이터 세트 단추를 전환하여 Profile에 대한 대상 데이터 세트를 사용하도록 설정합니다.

스키마 선택 대화 상자가 나타납니다. 새 데이터 세트에 적용할 스키마를 선택한 다음 완료​를 선택합니다.

필요에 따라 필드를 직접 매핑하거나 데이터 준비 함수를 사용하여 소스 데이터를 변환하여 계산 또는 계산된 값을 도출할 수 있습니다. 매퍼 함수 및 계산된 필드에 대한 자세한 내용은 데이터 준비 함수 안내서 또는 계산된 필드 안내서를 참조하십시오.

JSON 파일의 경우 필드를 다른 필드에 직접 매핑하는 것 외에도 개체를 다른 개체 및 배열에 직접 매핑할 수 있습니다. 또한 클라우드 저장소 소스 커넥터를 사용하여 JSON 파일의 배열과 같은 복잡한 데이터 유형을 미리 보고 매핑할 수 있습니다.

서로 다른 유형에 매핑할 수 없습니다. 예를 들어 개체를 배열에 매핑하거나 필드를 개체에 매핑할 수 없습니다.

Platform 선택한 대상 스키마나 데이터 세트를 기반으로 자동 매핑 필드에 대한 지능형 권장 사항을 제공합니다. 사용 사례에 맞게 매핑 규칙을 수동으로 조정할 수 있습니다.

선택한 데이터 집합에서 최대 100개의 샘플 데이터 행의 매핑 결과를 보려면 데이터 미리 보기​를 선택하십시오.

미리 보기 중에 ID 열은 매핑 결과를 확인할 때 필요한 주요 정보이므로 첫 번째 필드로 우선 순위가 지정됩니다.

소스 데이터가 매핑되면 닫기​를 선택합니다.

수집 실행 예약

예약 단계가 나타나므로 구성된 매핑을 사용하여 선택한 소스 데이터를 자동으로 수집하도록 수집 일정을 구성할 수 있습니다. 다음 표에서는 스케줄링에 대해 다양한 구성 가능한 필드에 대해 설명합니다.

필드 설명
빈도 선택 가능한 주파수는 Once, Minute, Hour, DayWeek를 포함합니다.
간격 선택한 주파수의 간격을 설정하는 정수입니다.
시작 시간 첫 번째 수집이 발생하도록 설정된 시기를 나타내는 UTC 타임스탬프입니다.
채우기 처음에 수집되는 데이터를 결정하는 부울 값입니다. 채우기​가 활성화되어 있으면 지정된 경로에 있는 모든 현재 파일이 첫 번째 예약된 수집 중에 수집됩니다. 채우기​가 비활성화되어 있으면 첫 번째 수집 실행과 시작 시간 사이에 로드된 파일만 수집됩니다. 시작 시간 전에 로드된 파일은 수집되지 않습니다.

데이터 흐름은 예약된 기준에 따라 데이터를 자동으로 수집하도록 설계되었습니다. 먼저 수집 빈도를 선택합니다. 그런 다음 간격을 설정하여 두 흐름 실행 사이의 기간을 지정합니다. 간격 값은 0이 아닌 정수여야 하며 15보다 크거나 같도록 설정해야 합니다.

수집 시작 시간을 설정하려면 시작 시간 상자에 표시되는 날짜 및 시간을 조정하십시오. 또는 달력 아이콘을 선택하여 시작 시간 값을 편집할 수 있습니다. 시작 시간은 UTC의 현재 시간보다 크거나 같아야 합니다.

예약의 값을 제공하고 다음​을 선택합니다.

1회 수집 데이터 흐름 설정

1회 수집을 설정하려면 빈도 드롭다운 화살표를 선택하고 Once​를 선택합니다. 시작 시간이 향후에 남아 있는 한 1회 빈도 수집을 위해 데이터 흐름 세트를 계속 편집할 수 있습니다. 시작 시간이 경과하면 1회 빈도 값을 더 이상 편집할 수 없습니다. ​일회성 수집 데이터 ​데이터 흐름을 설정할 때 대화형 및 백필이 표시되지 않습니다.

중요

FTP 커넥터를 사용할 때는 데이터 흐름을 1회 수집하도록 예약하는 것이 좋습니다.

예약에 적절한 값을 제공한 후 다음​을 선택합니다.

데이터 흐름 세부 정보 제공

데이터 흐름 세부 정보 단계가 나타나므로 새 데이터 흐름의 이름을 지정하고 간단한 설명을 제공할 수 있습니다.

이 프로세스 중에 부분 수집오류 진단​을 활성화할 수도 있습니다. 부분 수집​을 활성화하면 설정할 수 있는 특정 임계값까지 오류가 포함된 데이터를 수집할 수 있습니다. 오류 진단​을 활성화하면 별도로 일괄 처리되는 잘못된 데이터에 대한 세부 정보가 제공됩니다. 자세한 내용은 부분 배치 수집 개요를 참조하십시오.

데이터 흐름의 값을 제공하고 다음​을 선택합니다.

데이터 흐름 검토

새 데이터 흐름을 작성하기 전에 검토할 수 있는 검토 단계가 나타납니다. 세부 사항은 다음 범주 내에 그룹화됩니다.

  • 연결: 소스 유형, 선택한 소스 파일의 관련 경로 및 해당 소스 파일 내의 열 양을 표시합니다.
  • 데이터 세트 및 맵 필드 할당: 데이터 세트가 준수하는 스키마를 포함하여 소스 데이터가 수집되는 데이터 세트를 표시합니다.
  • 예약: 수집 예약의 활성 기간, 빈도 및 간격을 표시합니다.

데이터 흐름을 검토한 후 완료​를 클릭하고 데이터 흐름을 만들 시간을 잠시 허용합니다.

데이터 흐름 모니터링

데이터 흐름이 만들어지면 이를 통해 수집되는 데이터를 모니터링하여 수집률, 성공 및 오류에 대한 정보를 볼 수 있습니다. 데이터 흐름을 모니터링하는 방법에 대한 자세한 내용은 UI🔗의 계정 및 데이터 흐름 모니터링에서 자습서를 참조하십시오.

데이터 흐름 삭제

더 이상 필요하지 않거나 잘못 생성된 데이터 흐름은 데이터 흐름 작업 영역에서 사용할 수 있는 Delete 함수를 사용하여 삭제할 수 있습니다. 데이터 흐름 삭제 방법에 대한 자세한 내용은 UI🔗에서 데이터 흐름 삭제에 대한 자습서를 참조하십시오.

다음 단계

이 자습서를 따라 외부 클라우드 저장소에서 데이터를 가져올 데이터 흐름을 성공적으로 만들어 데이터 세트 모니터링에 대한 통찰력을 얻을 수 있습니다. 데이터 흐름 만들기에 대한 자세한 내용을 보려면 아래 비디오를 시청하여 학습 내용을 보완할 수 있습니다. 또한 이제 들어오는 데이터를 Real-time Customer Profile 및 Data Science Workspace 등의 다운스트림 Platform 서비스에서 사용할 수 있습니다. 자세한 내용은 다음 문서를 참조하십시오.

경고

다음 비디오에 표시된 Platform UI가 오래되었습니다. 최신 UI 스크린샷 및 기능은 위의 설명서를 참조하십시오.

부록

다음 섹션에서는 소스 커넥터 작업에 대한 추가 정보를 제공합니다.

데이터 흐름 비활성화

데이터 흐름을 만들면 즉시 활성 상태가 되고 제공된 일정에 따라 데이터를 수집합니다. 아래 지침에 따라 언제든지 활성 데이터 흐름을 비활성화할 수 있습니다.

소스 작업 영역에서 찾아보기 탭을 클릭합니다. 다음으로 비활성화하려는 활성 데이터 흐름과 연결된 계정 이름을 클릭합니다.

소스 활동 페이지가 나타납니다. 목록에서 활성 데이터 흐름을 선택하여 화면 오른쪽의 속성 열을 엽니다. 이 열에는 활성화 전환 단추가 있습니다. 데이터 흐름을 비활성화하려면 전환을 클릭하십시오. 동일한 전환을 사용하여 데이터 흐름을 비활성화한 후 다시 활성화할 수 있습니다.

Profile 모집단에 대한 인바운드 데이터 활성화

소스 커넥터의 인바운드 데이터를 Real-time Customer Profile 데이터를 강화 및 채우는 데 사용할 수 있습니다. Real-time Customer Profile 데이터 채우기에 대한 자세한 내용은 프로필 채우기의 자습서를 참조하십시오.

이 페이지에서는