Customer Data Feeds customer-data-feeds
Customer Data Feed (CDF) 파일에 대한 기본 정보 및 시작 방법에 대한 지침입니다. CDF개의 파일을 받거나 자세한 정보를 보려면 여기에서 시작하십시오.
파일 내용 및 목적 file-contents-purpose
CDF 파일에 Audience Manager 이벤트 호출(/event
)이 서버에 보내는 것과 동일한 데이터가 포함되어 있습니다. 여기에는 사용자 ID, trait IDs, segment IDs 및 이벤트 호출로 캡처된 기타 모든 매개 변수 등의 데이터가 포함됩니다. 내부 Audience Manager 시스템은 정해진 순서로 표시되는 필드로 구성된 컨텐츠가 있는 CDF 파일로 이벤트 데이터를 처리합니다. Audience Manager이(가) 매시간 CDF개의 파일을 생성하여 Amazon S3 서버의 안전한 고객별 버킷에 저장하려고 합니다. 사용자 인터페이스에 지정된 제한을 벗어나는 Audience Manager 데이터로 작업할 수 있도록 이러한 파일을 제공합니다.
- CDF 파일 전달을 설정하기 전에 타사 데이터 공급자의 타사 트레이트 내보내기에 대한 적절한 권한이 있는지 확인하십시오. Audience Manager은 현재 서드파티 데이터 공급자로부터 CDF 파일 게재 내보내기 권한을 요청하는 기능을 사용자 인터페이스에서 지원하지 않으므로 독립적으로 문의하십시오.
- CDF 파일을 프록시로 사용하여 페이지 트래픽을 모니터링하거나, 보고서 불일치를 조정하거나, 청구 등을 처리해서는 안 됩니다.
시작하기 getting-started
CDF 파일 배달을 시작하는 셀프 서비스 프로세스가 없습니다. 시작하려면 Audience Manager 컨설턴트나 고객 지원에 문의하십시오. 구현 중에 Audience Manager 담당자는 다음을 수행합니다.
- Amazon S3 저장소 버킷을 설정합니다.
- 파일 저장소 버킷에 읽기 전용 S3 인증 자격 증명을 제공하십시오. 다른 고객에 속한 디렉토리와 파일은 보거나 액세스할 수 없습니다.
파일 알림 및 CDF 파일은 다운로드할 준비가 되면 S3 버킷에 표시됩니다. 할당된 S3 디렉터리에서 파일을 모니터링하고 다운로드해야 합니다. 고객 데이터 피드 파일 처리 알림을 참조하십시오.
다음 단계 next-steps
아래 섹션 및 고객 데이터 피드 FAQ를 통해 이 서비스에 더 익숙해질 수 있습니다.
Customer Data Feed개 콘텐츠 정의됨 cdf-defined
CDF 파일에 있는 데이터 요소와 배열을 표시 순서에 따라 나열하고 정의합니다. 정의에 데이터 형식이 포함되어 있지만 이 정보는 CDF 파일에 포함되지 않습니다.
정의 definitions
CDF 파일에 아래에 정의된 일부 또는 모든 필드가 포함되어 있습니다. 내부 파일 조직에 대한 자세한 내용은 고객 데이터 피드 파일 구조를 참조하십시오.
Event Time
CDF 파일이 데이터 수집 서버(DCS)에서 처리된 시간입니다. 타임스탬프는 yyyy-mm-dd hhss 형식을 사용하며 UTC 시간대로 설정됩니다.
참고: 이벤트 시간 은(는) 이(가) 아닙니다.
- 페이지 이벤트 또는 이벤트 호출 시간이 해당 시간에 가까울 수 있지만 해당 시간 자체입니다.
- 파일 이름의 DCS 시간과 관련되어 있습니다. 고객 데이터 피드 파일 이름 시간 및 파일 내용 시간...도 참조하세요.
Container ID
Realized Traits
방문자가 이벤트 호출에서 실현(적격)한 모든 트레이트를 포함하는 트레이트 ID의 배열입니다.
이 배열에는 방문자가 이전에 자격을 부여받은 트레이트와 이 이벤트 호출을 통해 자격을 다시 부여받은 트레이트가 포함될 수 있습니다.
Realized Segments
Request Parameters
모든 매개 변수(변수, ID, 키-값 쌍, 장치 광고 ID 등)를 캡처하는 문자열 이벤트 호출 시 전달되었습니다.
축약된 예:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
IP Data Type
MCDevice
All Segments
All Traits
Customer Data Feed 파일 구조 cdf-file-structure
CDF 파일의 데이터 구조를 나열하고 정의합니다. 여기에는 데이터 시퀀스, 필드 구분 기호 및 구분 기호, 데이터 파일 맵 및 샘플 파일이 포함됩니다.
데이터 필드 식별자 및 시퀀스 identifiers-and-sequence
CDF개 파일에 레이블이 지정된 열 또는 필드 헤더가 없습니다. 대신 CDF 파일은 인쇄되지 않는 ASCII자의 필드 및 배열을 정의합니다. 또한 CDF 파일은 각 필드와 배열을 특정 순서로 나열합니다. 필드 식별자 및 순서를 이해하면 파일을 올바르게 구문 분석하는 데 도움이 됩니다.
인쇄되지 않는 이러한 문자는 CDF 파일의 요소 및 구조를 정의합니다.
- Ctrl + a(ASCII
001
또는^A
)는 인쇄되지 않는 공간 표시기로 개별 필드의 데이터를 구분합니다. - Ctrl+b(ASCII
002
또는^B
)는 데이터와 요청 매개 변수를 구분합니다. - Ctrl + c(ASCII
003
또는^C
)는 키-값 쌍을 정의합니다.
중요: Audience Manager은(는) 향후 릴리스에서 CDF 파일의 끝에 새 필드를 추가할 수 있는 권한을 보유합니다. 즉, 파일 구문 분석 시스템의 기술 설계에서 고정된 수의 열을 가정해서는 안 됩니다(기존 열의 순서가 고정되어 있을 수도 있음).
CDF 파일의 데이터는 아래에 표시된 순서로 표시됩니다. 이러한 필드 대신 /N이 표시되어 null 값을 나타낼 수 있습니다.
- 이벤트 시간
- 장치
- 컨테이너 ID
- 실현된 트레이트
- 실현된 세그먼트
- 요청 매개 변수
- Referer
- IP 주소
- Experience Cloud 장치 ID(또는 MID). 쿠키 및 Adobe Experience Platform Identity 서비스도 참조하세요.
- 모든 세그먼트
- 모든 트레이트
필드 설명은 정의된 고객 데이터 피드 콘텐츠를 참조하십시오.
CDF 파일 맵 cdf-file-map
CDF 파일 데이터가 아래 표시된 순서로 나타납니다.
배열 식별
CDF 파일의 배열은 Ctrl + a
필드 구분 기호로 시작하고 끝납니다. 이렇게 하면 배열의 첫 번째 요소가 독립 실행형 데이터 필드처럼 표시됩니다. 예를 들어 실현된 traits 배열은 ^A1234
(으)로 시작합니다. 배열 구분 기호 및 ID ^B5678
이(가) 이 항목 뒤에 옵니다. 따라서 실현된 traits 배열의 첫 번째 요소가 ID 5678이라고 생각하게 됩니다(^B
(으)로 시작됨). 그렇지 않으므로 데이터 파일의 시퀀스 및 구조에 익숙해야 합니다. 실현된 trait 배열(또는 CDF 파일의 다른 배열)의 첫 번째 요소는 ^A
(으)로 시작되지만 파일의 모양 또는 위치 순서는 배열의 시작을 정의합니다. 그리고 배열의 첫 번째 요소는 항상 ^A
만큼 이전 항목에서 분리됩니다.
샘플 CDF 파일 sample-file
샘플 CDF 파일은 다음과 비슷합니다. 페이지에 맞게 하기 위해 이 예제에 줄바꿈을 삽입했습니다.
Customer Data Feed 파일 이름 지정 규칙 cdf-naming-conventions
아래 섹션에 CDF 파일 이름의 요소를 나열하고 정의합니다.
CDF 파일 이름: 구문 및 예제 cdf-file-name
일반적인 CDF 파일 이름에는 아래 나열된 요소가 포함되어 있습니다. 기울임꼴 은(는) 변수 자리 표시자를 나타냅니다.
구문
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
예
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
S3 저장소 버킷에서 파일은 파트너 ID(PID), 일 및 시간별로 오름차순으로 정렬됩니다.
CDF개의 파일 이름 요소가 정의됨 cdf-file-name-elements
다음 표는 CDF 파일 이름의 요소를 나열하고 정의합니다.
s3://aam-cdf/
your S3 bucket name
day=yyyy-mm-dd
hour=hh
partner ID
File Sequence_0
.gz
Customer Data Feed개의 파일 처리 알림 cdf-file-processing-notifications
Audience Manager이(가) Customer Data File (CDF)을(를) 다운로드할 준비가 되면 알리기 위해 S3 디렉터리에 .info
파일을 씁니다. .info
파일에는 CDF 파일의 내용에 대한 JSON 형식의 메타데이터도 포함되어 있습니다. 이 알림 파일에서 사용하는 구문과 필드에 대한 정보는 이 섹션을 검토하십시오.
샘플 정보 파일 sample-info-file
각 .info
파일에는 Files
및 Totals
섹션이 있습니다. Files
섹션에는 각 시간별 파일에 대한 특정 지표를 포함하는 배열이 포함되어 있습니다. Totals
섹션에는 특정 날짜의 모든 CDF 파일에서 집계된 지표가 포함되어 있습니다. .info
파일의 내용은 다음 예제와 비슷합니다.
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
정의된 정보 파일 필드 info-file-fields-defined
다음 표는 CDF .info
파일의 요소를 나열하고 정의합니다.
Files 개체
Files
FileByteSize
FileChecksumMD5
ETag
이(가) 파일의 MD5 체크섬과 동일하지 않습니다.FileName
FileSequenceNumber
Totals 객체
Totals
Day
Hour
TotalByteSize
TotalNumberFiles
Customer Data Feed 파일 이름 시간과 파일 내용 시간이 다릅니다. different-processing-times
CDF 파일에 파일 이름과 파일 내용에 타임스탬프가 있습니다. 이 타임스탬프는 동일한 CDF 파일에 대해 다른 이벤트 프로세스를 기록합니다. 동일한 파일의 이름과 내용에서 서로 다른 타임스탬프를 보는 것은 드문 일이 아닙니다. 각 타임스탬프를 이해하면 이 데이터로 작업하거나 시간별로 정렬하려고 할 때 발생하는 일반적인 실수를 방지하는 데 도움이 됩니다.
CDF개 파일 타임스탬프 찾기 locating-timestamps
CDF개의 파일이 서로 다른 두 위치에서 시간을 다르게 기록합니다.
타임스탬프 간 차이점 이해 understanding-timestamps
다음 표에서는 CDF 파일 타임스탬프에 대한 추가 세부 정보와 이를 올바르게 사용하는 방법에 대한 정보를 제공합니다.
CDF 파일 이름의 타임스탬프는 Audience Manager이(가) 배달을 위해 파일 준비를 시작한 시간을 표시합니다. 이 타임스탬프는 UTC 시간대로 설정되어 있습니다. 이 메서드는 hour=
매개 변수를 사용하며, 시간은 24시간 표기법으로 2자리 시간으로 형식이 지정됩니다. 이 시간은 파일 콘텐츠에 기록된 이벤트 시간과 다를 수 있습니다. CDF 파일을 사용하여 작업할 때 경우에 따라 S3 버킷이 특정 시간 동안 비어 있는 것을 확인할 수 있습니다. 빈 버킷 수단은 다음 중 하나를 의미할 수 있습니다.
- 해당 시간에 대한 데이터가 없습니다.
- 서버에 부하가 심해서 특정 시간 동안 파일을 처리할 수 없습니다. 서버가 작업을 완료하면 이전 시간 버킷 파일에 있어야 하는 파일을 이후 시간 값이 있는 버킷에 넣습니다. 예를 들어 17시간 버킷에 있어야 하는 파일이 18시간 버킷에 표시되면(파일 이름에
hour=18
이(가) 있음) 이 표시됩니다. 이 경우 서버에서 17시간 내에 파일 처리를 시작했지만 해당 시간 간격 내에 완료할 수 없을 수 있습니다. 대신 파일이 다음 시간 버킷으로 푸시됩니다.
중요: 파일 이름 타임스탬프를 사용하여 이벤트를 시간별로 그룹화하지 마십시오. 시간별로 그룹화해야 하는 경우 파일 콘텐츠의 EventTime
타임스탬프를 사용하십시오.
yyyy-mm-dd hh:mm:ss
형식의 EventTime
필드를 사용합니다. 이 시간은 페이지에서 이벤트의 실제 시간에 가깝지만 파일 이름의 시간 표시기와 다를 수 있습니다.팁: 파일 이름의
hour=
타임스탬프와 달리 EventTime
을(를) 사용하여 시간별로 데이터를 그룹화할 수 있습니다.