기본 정보 Customer Data Feed (CDF) 파일 및 시작 방법에 대한 지침입니다. 수신에 관심이 있다면 여기에서 시작하십시오 CDF 파일 또는 더 많은 정보를 원할 수 있습니다.
CDF 파일에는 Audience Manager 이벤트 호출(/event
)이 서버에 보내는 것과 동일한 데이터가 포함되어 있습니다. 여기에는 사용자 ID와 같은 데이터가 포함됩니다. trait IDs, segment IDs, 및 이벤트 호출로 캡처된 다른 모든 매개 변수. 내부 Audience Manager 시스템은 이벤트 데이터를 CDF 내용이 포함된 파일은 설정된 순서로 표시되는 필드로 구성됩니다. Audience Manager 생성하려고 함 CDF 매시간 파일을 생성하여 Amazon S3 server. 작업할 수 있도록 이러한 파일을 제공합니다 Audience Manager 사용자 인터페이스에 의해 적용되는 제한을 벗어나는 데이터.
CDF 파일을 사용할 때는 다음 제한 사항을 참고하십시오.
시작할 셀프 서비스 프로세스가 없습니다 CDF 파일 전달. 다음 사항에 문의하십시오. Audience Manager 시작하려면 컨설턴트나 고객 지원 센터에 문의하십시오. 구현 중에 Audience Manager 담당자:
파일 알림 및 CDF 파일이 S3 다운로드할 준비가 되면 버킷합니다. 사용자는 할당된 위치에서 파일을 모니터링하고 다운로드할 책임이 있습니다 S3 디렉토리. 고객 데이터 피드 파일 처리 알림을 참조하십시오.
아래 섹션과 고객 데이터 피드 FAQ 이 서비스에 더 익숙해지도록 도와 줄 수 있습니까?
의 데이터 요소 및 배열을 나열하고 정의합니다 CDF 파일, 모양 순서대로 정의는 데이터 유형을 포함하지만, 이 정보는 CDF 파일.
이벤트 픽셀은 CDF 구성에서 기본적으로 제외됩니다. CDF 파일에 이벤트 픽셀을 포함하려는 경우 클라이언트 지원팀에 제공하도록 요청에 지정합니다. 각 이벤트 픽셀은 CDF 파일에서 고유한 행으로 채워집니다.
A CDF 파일에는 아래에 정의된 일부 또는 모든 필드가 포함되어 있습니다. 내부 파일 조직에 대한 자세한 내용은 고객 데이터 피드 파일 구조.
필드 | 데이터 유형 | 설명 |
---|---|---|
|
Timestamp |
CDF 파일이 데이터 수집 서버 (DCS). 타임스탬프는 yyyy-mm-dd hh:mm:ss UTC 표준 시간대에서 및 를 지정합니다.
참고: 이벤트 시간 is not:
|
|
문자열 |
이것은 고유 사용자 ID (UUID) - 사이트 방문자에 대한 38자리 장치 ID입니다. Audience Manager의 ID 색인을 참조하십시오. |
|
숫자 |
ID 동기화를 실행하는 컨테이너의 ID입니다. 이 필드는 페이지의 d_nsid 사이트 구현 내 필드. 그렇지 않으면 기본값 0이 CDF 파일에 포함되지 않습니다. |
|
숫자 배열 |
방문자가 이벤트 호출에서 실현된(에 자격)모든 트레이트를 포함하는 트레이트 ID의 배열입니다. 이 배열에는 방문자가 이전에 자격을 취득한 트레이트와 이 이벤트 호출을 통해 자격을 다시 부여받은 트레이트가 포함될 수 있습니다. |
|
숫자 배열 |
방문자가 이벤트 호출에서 구현된(에 적합)모든 세그먼트를 포함하는 세그먼트 ID의 배열입니다. |
|
문자열 |
모든 매개 변수(변수, ID, 키-값 쌍, 장치 광고 ID 등)를 캡처하는 문자열 이벤트 호출 시 전달됩니다. 단축된 예: |
|
문자열 |
참조 페이지의 인코딩되지 않은 URL(있는 경우)입니다. |
|
문자열 |
이벤트 호출에서 캡처된 방문자의 IP 주소입니다. |
|
문자열 |
다음 Experience Cloud 사이트 방문자에게 지정된 MID(ID)입니다. 또한, 쿠키 및 Adobe Experience Platform Identity 서비스. |
|
숫자 배열 |
방문자가 자격을 갖는 새 세그먼트와 이전에 실현된 세그먼트를 포함하는 세그먼트 ID의 배열입니다. |
|
숫자 배열 |
마지막으로 생성된 데이터 피드 이후 방문자가 자격을 부여한 트레이트와 새로운 트레이트를 포함하는 자사 및 타사 트레이트 ID의 배열입니다. |
의 데이터 구조를 나열하고 정의합니다 CDF 파일. 여기에는 데이터 시퀀스, 필드 구분 기호 및 구분 기호, 데이터 파일 맵 및 샘플 파일이 포함됩니다.
CDF 파일에 레이블이 지정된 열 또는 필드 머리글이 포함되어 있지 않습니다. 대신, CDF 파일은 인쇄되지 않는 필드 및 배열을 정의합니다. ASCII 자. 또한, CDF 파일에는 각 필드 및 배열이 특정 순서로 나열됩니다. 필드 식별자 및 순서를 이해하면 파일을 제대로 구문 분석하는 데 도움이 됩니다.
CDF 파일 요소 | 설명 |
---|---|
필드 구분 기호 및 구분 기호 |
이러한 인쇄되지 않는 문자는 CDF 파일의 요소와 구조를 정의합니다.
|
필드 시퀀스 |
중요 사항: Audience Manager 는 향후 릴리스에서 CDF 파일의 끝에 새 필드를 추가할 권한을 갖습니다. 즉, 파일 구문 분석 시스템의 기술 설계에서는 고정된 수의 열을 가정하지 않아야 합니다(하지만 기존 열에 대해 고정된 순서가 있을 수 있음). CDF 파일의 데이터는 아래 표시된 순서대로 나타납니다. /N은 이러한 필드 대신 나타날 수 있으며 null 값을 나타냅니다.
필드 설명은 다음을 참조하십시오 정의된 고객 데이터 피드 컨텐츠. |
CDF 파일 데이터는 아래 표시된 순서대로 나타납니다.
의 배열 CDF 파일 시작 및 종료 Ctrl + a
필드 구분자입니다. 이렇게 하면 배열의 첫 번째 요소가 독립형 데이터 필드와 같이 표시됩니다. 예를 들어, traits 다음으로 시작 ^A1234
. 배열 구분 기호 및 ID ^B5678
이 항목을 따릅니다. 그 결과, 여러분은 깨달음의 첫 번째 요소가 traits 배열은 ID 5678입니다(다음으로 시작됨) ^B
). 그렇지 않으므로 데이터 파일의 시퀀스 및 구조를 잘 알고 있어야 합니다. 첫 번째 요소가 trait 어레이(또는 CDF 파일) 다음으로 시작 ^A
로 지정하는 경우 파일의 모양 또는 위치 순서는 배열의 시작을 정의합니다. 그리고 배열의 첫 번째 요소는 항상 이전 항목과 분리됩니다 ^A
.
샘플 CDF 파일 모양은 다음과 비슷합니다. 이 예제에 줄바꿈을 삽입하여 페이지에 맞게 구성했습니다.
아래 섹션을 나열하고 CDF 파일 이름.
일반적인 CDF 파일 이름에는 아래 나열된 요소가 포함됩니다. 참고, 기울임체 변수 자리 표시자를 나타냅니다.
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
사용자 S3 저장소 버킷, 파일은 파트너 ID(PID), 일, 시간
다음 표에는 CDF 파일 이름.
파일 이름 요소 | 설명 |
---|---|
|
Amazon S3 서버의 CDF 파일에 대한 기본 루트 저장소 버킷입니다. |
|
CDF 파일을 포함하는 읽기 전용 S3 버킷의 이름입니다. |
|
파일을 처리한 날짜입니다. |
|
24시간 표기법으로 표시되며 UTC 표준 시간대로 설정된 시간 값입니다. 또한, 고객 데이터 피드 파일 이름 시간 및 파일 콘텐츠 시간.... |
|
파트너 ID입니다. |
|
파일 시퀀스를 식별하는 값입니다. 시퀀스가 다음과 같이 증가합니다. 0_0_0 , 0_1_0, 0_2_0...1_0_0 |
|
gzip 파일 확장자입니다. CDF 파일은 gzip 압축됩니다. |
Audience Manager 쓰기 .info
파일에 S3 디렉토리 Customer Data File (CDF)을 다운로드할 수 있습니다. 다음 .info
파일 확장에도 포함됩니다 JSON 컨텐츠의 내용에 대한 형식이 지정된 메타데이터 CDF 파일. 이 알림 파일에서 사용되는 구문 및 필드에 대한 자세한 내용은 이 섹션을 참조하십시오.
각 .info
파일에 가 있습니다. Files
및 Totals
섹션을 참조하십시오. 다음 Files
섹션에는 각 시간별 파일에 대한 특정 지표를 포함하는 배열이 포함되어 있습니다. 다음 Totals
섹션에는 모든 페이지에 대해 집계된 지표가 포함되어 있습니다 CDF 특정 날짜의 파일. 사용자의 콘텐츠 .info
파일은 다음 예제와 비슷합니다.
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
다음 표는 CDF .info
파일.
필드 | 설명 |
---|---|
|
CDF 파일에 대한 메타데이터가 포함된 배열을 시작합니다. |
|
파일 크기(바이트)입니다. |
|
Amazon S3 ETag입니다. 하이픈 다음에 나오는 숫자는 다중 부분 업로드 중에 파일을 작성하는 데 사용되는 부품 수를 보여줍니다. 다음 |
|
파일 이름입니다. 자세한 내용은 고객 데이터 피드 파일 이름 지정 규칙. |
|
각 파일의 인덱스 번호입니다. |
필드 | 설명 |
---|---|
|
모든 CDF 파일에 대해 집계된 데이터를 포함하는 개체를 시작합니다. |
|
데이터를 사용할 수 있는 날짜입니다. 사용 yyyy-mm-dd 형식 지정 |
|
데이터를 사용할 수 있는 시간입니다. UTC 표준 시간대에 설정된 24시간 형식을 사용합니다. |
|
해당 날짜에 대한 모든 CDF 파일의 총 크기(바이트)입니다. |
|
S3 디렉토리에 업로드된 총 파일 수입니다. |
사용자 CDF 파일에는 파일 이름 및 파일 컨텐츠에 타임스탬프가 들어 있습니다. 이러한 타임스탬프는 동일한 이벤트에 대해 다른 이벤트 프로세스를 기록합니다 CDF 파일. 동일한 파일의 이름과 내용에 다른 타임스탬프가 표시되는 것은 일반적입니다. 각 타임스탬프를 이해하면 이 데이터를 사용하여 작업하거나 시간별로 정렬할 때 일반적인 실수를 방지할 수 있습니다.
CDF 파일은 두 개의 별도 위치에서 시간을 다르게 기록합니다.
다음 표에는 CDF 파일 타임스탬프와 제대로 사용하는 방법에 대한 정보가 포함되어 있습니다.
타임스탬프 위치 | 설명 |
---|---|
파일 이름 | 내 타임스탬프 CDF 파일 이름은 Audience Manager 파일 전달을 위한 준비를 시작했습니다. 이 타임스탬프는 UTC 시간대 이 템플릿은 를 사용합니다 hour= 매개 변수. 24시간 표기법으로 2자리 시간으로 서식이 지정된 시간입니다. 이 시간은 파일 컨텐츠에 기록된 이벤트 시간과 다를 수 있습니다. 작업 시 CDF 파일, 경우에 따라 S3 특정 시간 동안 버킷이 비어 있습니다. 빈 버킷은 다음 중 하나를 의미할 수 있습니다.
중요 사항: 파일 이름 타임스탬프를 사용하여 시간별로 이벤트를 그룹화하지 마십시오. 시간별로 그룹화해야 하는 경우 EventTime 파일 내용의 타임스탬프. |
파일 내용 | 내 타임스탬프 CDF 파일 내용은 Data Collection Servers 파일 처리를 시작했습니다. 이 타임스탬프는 UTC 시간대 이 템플릿은 를 사용합니다 EventTime 필드, 형식이 지정된 시간 yyyy-mm-dd hh:mm:ss . 이 시간은 페이지에서 실제 이벤트 시간에 가깝지만 파일 이름에 있는 시간 표시기와 다를 수 있습니다. 팁: 와 달리 hour= 파일 이름의 타임스탬프를 사용하여 EventTime 시간별로 데이터를 그룹화합니다. |