Customer Data Feeds customer-data-feeds
有關Customer Data Feed (CDF)檔案的基本資訊,以及如何開始使用的說明。 如果您有興趣接收CDF個檔案或只是想要更多資訊,請從這裡開始。
檔案內容和用途 file-contents-purpose
CDF檔案包含的資料與Audience Manager事件呼叫(/event
)傳送至我們伺服器的資料相同。 這包括使用者ID、trait IDs、segment IDs等資料,以及事件呼叫所擷取的所有其他引數。 內部Audience Manager系統將事件資料處理為CDF檔案,其內容已整理到以設定順序出現的欄位中。 Audience Manager嘗試每小時產生CDF個檔案,並將它們儲存在Amazon S3伺服器上安全、特定於客戶的貯體中。 我們會提供這些檔案,讓您能夠不受使用者介面的限制使用Audience Manager資料。
- 設定CDF檔案傳送之前,請確定您擁有來自協力廠商資料提供者的適當許可權,可匯出協力廠商特徵。 Audience Manager目前不支援使用者介面中的功能,無法向協力廠商資料提供者要求CDF檔案傳遞匯出許可權,因此請單獨聯絡他們。
- 您不應該使用CDF檔案當做Proxy來監視頁面流量、調解報告差異或計費等。
快速入門 getting-started
沒有自助式處理程式可啟動CDF檔案傳遞。 請連絡您的Audience Manager顧問或客戶服務以開始使用。 實施期間,您的Audience Manager代表將:
- 設定您的Amazon S3儲存貯體。
- 提供唯讀的S3驗證認證給您的檔案儲存貯體。 您將無法檢視或存取其他客戶的目錄和檔案。
當檔案通知和CDF檔案準備下載時,它們將會顯示在您的S3儲存貯體中。 您負責監視及下載您指派的S3目錄中的檔案。 請參閱客戶資料摘要檔案處理通知。
後續步驟 next-steps
以下章節及客戶資料摘要常見問題集可協助您更熟悉此服務。
已定義Customer Data Feed內容 cdf-defined
依照外觀順序,列出並定義CDF檔案中的資料元素和陣列。 定義包含資料型別,但此資訊不是CDF檔案的一部分。
定義 definitions
CDF檔案包含下面定義的部分或全部欄位。 如需內部檔案組織的相關資訊,請參閱客戶資料摘要檔案結構。
Event Time
資料收集伺服器 (DCS)處理CDF檔案的時間。 時間戳記使用 yyyy-mm-dd hhss 格式,且設定為UTC時區。
注意:事件時間 不是:
- 頁面事件或事件呼叫本身的時間,雖然可能接近這些時間。
- 與檔案名稱中的DCS時數相關。 另請參閱客戶資料摘要檔案名稱時間和檔案內容時間……。
Container ID
Realized Traits
一個特徵ID陣列,包含訪客在事件呼叫中變現(符合資格)的所有特徵。
請注意,陣列可包含訪客之前已符合資格的特徵,以及訪客透過此事件呼叫重新符合資格的特徵。
Realized Segments
Request Parameters
擷取所有引數(變數、ID、機碼值組、裝置廣告ID等)的字串。 已傳入事件呼叫。
簡短範例:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
IP Data Type
All Segments
All Traits
Customer Data Feed檔案結構 cdf-file-structure
列出並定義CDF檔案的資料結構。 這包括資料順序、欄位分隔符號和分隔符號、資料檔案對映和範例檔案。
資料欄位識別碼和順序 identifiers-and-sequence
CDF個檔案未包含標示的欄或欄位標題。 相反,CDF檔案會定義具有非列印ASCII字元的欄位和陣列。 此外,CDF檔案會以特定順序列出每個欄位和陣列。 瞭解欄位識別碼和順序將有助於您正確剖析檔案。
這些非列印字元定義CDF檔案的元素和結構:
- Ctrl + a (ASCII
001
或^A
)以非列印空間指示器分隔個別欄位中的資料。 - Ctrl + b (ASCII
002
或^B
)將資料與陣列及要求引數分開。 - Ctrl + c (ASCII
003
或^C
)定義機碼值組。
重要: Audience Manager保留在未來發行版本中新增欄位至CDF檔案結尾的權利。 這表示檔案剖析系統的技術設計不應假設欄數固定(但現有欄可能會假設順序固定)。
CDF檔案中的資料會以下列順序顯示。/N可以出現在這些欄位中,代表空值。
- 事件時間
- 裝置
- 容器 ID
- 已實現的特徵
- 已實現的區段
- 要求參數
- Referer
- IP 位址
- Experience Cloud裝置ID (或MID)。 另請參閱 Cookie與Adobe Experience Platform Identity服務
- 所有區段
- 所有特徵
如需欄位說明,請參閱已定義的客戶資料摘要內容。
CDF檔案地圖 cdf-file-map
CDF檔案資料會以下列順序顯示。
識別陣列
CDF檔案中的陣列以Ctrl + a
欄位分隔符號開始和結束。 這會使陣列中的第一個元素看起來像獨立資料欄位。 例如,已實現的traits陣列以^A1234
開頭。 陣列分隔符號和識別碼^B5678
會依循此專案。 因此,您可能會認為已實現的traits陣列中的第一個元素識別碼5678 (因為它以^B
開頭)。 但事實並非如此,因此您需要熟悉資料檔案的順序和結構。 即使已實現的trait陣列中的第一個元素(或CDF檔案中的任何其他陣列)以^A
開頭,檔案中的外觀順序或位置定義陣列的開頭。 而且,陣列中的第一個元素一律會以^A
與前一個專案分開。
範例CDF檔案 sample-file
範例CDF檔案可能類似於以下內容。 我們在此範例中插入分行符號,以協助它符合頁面。
Customer Data Feed檔案命名慣例 cdf-naming-conventions
以下區段列出並定義您CDF檔案名稱中的元素。
CDF檔案名稱:語法和範例 cdf-file-name
一般CDF檔案名稱包含下列專案。 注意,斜體 表示變數預留位置:
語法
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
範例
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
在您的S3儲存貯體中,檔案會依合作夥伴ID (PID)、日和小時以遞增順序排序。
已定義CDF個檔案名稱元素 cdf-file-name-elements
下表列出並定義CDF檔案名稱中的專案。
s3://aam-cdf/
your S3 bucket name
day=yyyy-mm-dd
hour=hh
partner ID
File Sequence_0
.gz
Customer Data Feed個檔案處理通知 cdf-file-processing-notifications
Audience Manager會將.info
檔案寫入您的S3目錄,以便在您的Customer Data File (CDF)準備下載時通知您。 .info
檔案也包含有關CDF檔案內容的JSON格式化中繼資料。 請參閱本節,瞭解此通知檔案使用的語法和欄位。
範例資訊檔案 sample-info-file
每個.info
檔案都包含Files
和Totals
區段。 Files
區段包含一個陣列,內含每個每小時檔案的特定量度。 Totals
區段包含特定日期所有CDF檔案的彙總量度。 .info
檔案的內容可能類似於以下範例。
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
已定義的資訊檔案欄位 info-file-fields-defined
下清單格列出並定義CDF .info
檔案中的專案。
檔案物件
Files
FileByteSize
FileChecksumMD5
ETag
與檔案的MD5總和檢查碼不相同。FileName
FileSequenceNumber
總計物件
Totals
Day
Hour
TotalByteSize
TotalNumberFiles
Customer Data Feed檔案名稱時間和檔案內容時間不同 different-processing-times
您的CDF檔案在檔案名稱和檔案內容中包含時間戳記。 這些時間戳記會針對相同的CDF檔案記錄不同的事件程式。 在同一個檔案的名稱和內容中看到不同的時間戳記是很常見的現象。 瞭解每個時間戳記可協助您在處理此資料或嘗試依時間排序資料時,避免常見錯誤。
找到CDF個檔案時間戳記 locating-timestamps
CDF個檔案記錄時間在2個不同位置不同。
瞭解時間戳記之間的差異 understanding-timestamps
下表提供有關您的CDF檔案時間戳記的更多詳細資料,以及如何正確使用這些時間戳記的資訊。
CDF檔案名稱中的時間戳記會標示Audience Manager開始準備傳送檔案的時間。 此時間戳記設定在UTC時區。 它使用hour=
引數,時間格式為24小時表示法的2位數小時。 這個時間可能與檔案內容中記錄的事件時間不同。 處理CDF檔案時,有時您會注意到您的S3貯體在某一小時是空的。 空白貯體表示可能有下列其中一種情況:
- 沒有該特定小時的資料。
- 我們的伺服器負載過重,在特定小時內無法處理檔案。 當伺服器趕上進度時,會將原本應該放在較早時段檔案中的檔案放入具有較晚時間值的貯體中。 例如,當應在17小時貯體中的檔案出現在18小時貯體中(檔案名稱中包含
hour=18
)時,您會看到此訊息。 在此情況下,伺服器可能會在17小時內開始處理您的檔案,但無法在該時間間隔內完成它。 相反地,檔案會推送至下一個每小時時段。
重要:請勿使用檔案名稱時間戳記,依時間將事件分組。 如果您需要依時間分組,請在檔案內容中使用EventTime
時間戳記。
EventTime
欄位,時間格式為 yyyy-mm-dd hh:mm:ss
。 這個時間接近頁面上事件的實際時間,但可能不同於檔案名稱中的小時指標。提示:與檔案名稱中的
hour=
時間戳記不同,您可以使用EventTime
依時間將資料分組。