有關 Customer Data Feed (CDF)檔案和有關如何開始的說明。 如果您有興趣接收 CDF 檔案或只是想要更多資訊。
CDF 檔案包含的資料與 Audience Manager 事件呼叫 (/event
) 傳送至我們伺服器的資料相同。包括用戶ID等資料, trait IDs。 segment IDs,以及事件調用捕獲的所有其他參數。 內部 Audience Manager 系統將事件資料處理到 CDF 檔案,其內容組織為按設定順序顯示的欄位。 Audience Manager 嘗試生成 CDF 每小時歸檔,並將它們儲存在一個安全、特定於客戶的儲存桶中 Amazon S3 伺服器。 我們提供這些檔案,以便您能夠 Audience Manager 超出用戶介面限制的資料。
使用CDF檔案時請注意以下限制:
沒有要啟動的自助服務進程 CDF 檔案傳遞。 聯繫您 Audience Manager 咨詢顧問或客戶服務開始。 在實施過程中, Audience Manager 代表:
檔案通知和 CDF 檔案將出現在 S3 當它們準備下載時儲存。 您負責監視和下載分配的檔案 S3 的子菜單。 請參閱客戶資料摘要檔案處理通知。
以下各節和 客戶資料源常見問題 可以幫助您更熟悉此服務。
列出並定義 CDF 按外觀順序排列。 定義包括資料類型,但此資訊不是 CDF 的子菜單。
CDF配置中預設排除事件像素。 如果希望將事件像素包括在CDF檔案中,請確保在客戶保護請求中指定。 每個事件像素將作為CDF檔案中的唯一行填充。
A CDF 檔案包含下面定義的部分或全部欄位。 有關內部檔案組織的資訊,請參見 客戶資料饋送檔案結構。
欄位 | 資料類型 | 說明 |
---|---|---|
|
時間戳 |
CDF檔案由 資料收集伺服器 (DCS)。 時間戳使用 yyyy-mm-dd hh:mm:ss 格式,並在UTC時區中設定。
注:事件時間 不是:
|
|
字串 |
這是 唯一用戶ID (UUID),是站點訪問者的38位設備ID。 也請參閱 Audience Manager 內的 ID 索引。 |
|
數值 |
觸發ID同步的容器的ID。 僅當在 d_nsid 欄位。 否則,CDF檔案中將不包含預設值0。 |
|
數字陣列 |
一組特性ID,包含訪問者在事件調用中實現(限定)的所有特性。 請注意,陣列可以包含訪問者以前已通過此事件調用確認的特徵,以及通過此事件調用重新確認這些特徵。 |
|
數字陣列 |
一組段ID,包含訪問者在事件調用中實現(限定)的所有段。 |
|
字串 |
捕獲所有參數(變數、ID、鍵值對、設備通告ID等)的字串 在事件呼叫中傳入。 縮寫示例: |
|
字串 |
引用頁的未編碼URL(如果有)。 |
|
字串 |
在事件調用中捕獲的訪問者的IP地址。 |
|
字串 |
的 Experience Cloud 分配給站點訪問者的ID(MID)。 另請參見 Cookie和AdobeExperience Platform標識服務。 |
|
數字陣列 |
一組段ID,包含先前實現的段和訪問者限定的新段。 |
|
數字陣列 |
一組第一和第三方特性ID,包含訪問者自上次生成資料饋送以來所限定的先前實現的特性和新特性。 |
列出並定義 CDF 的子菜單。 這包括資料序列、欄位分隔符和分隔符、資料檔案映射和示例檔案。
CDF 檔案不包含已標籤的列或欄位標題。 相反, CDF 檔案定義欄位和陣列,但不打印 ASCII 字元。 另外, CDF 檔案按特定順序列出每個欄位和陣列。 瞭解欄位標識符和順序將幫助您正確分析檔案。
CDF檔案元素 | 說明 |
---|---|
欄位分隔符和分隔符 |
這些非打印字元定義CDF檔案的元素和結構:
|
欄位序列 |
重要提示: Audience Manager 保留在將來版本中將新欄位添加到CDF檔案末尾的權利。 這意味著檔案分析系統的技術設計不應假定列數固定(儘管它可能假定現有列的順序固定)。 CDF檔案中的資料按如下所示的順序顯示。/N可能會代替這些欄位中的任何一個,表示空值。
有關欄位說明,請參見 已定義客戶資料饋送內容。 |
CDF 檔案資料按如下所示的順序顯示。
在 CDF 檔案以開頭和結尾 Ctrl + a
欄位分隔符。 這使陣列中的第一個元素看起來像獨立資料欄位。 例如, traits 陣列開始於 ^A1234
。 陣列分隔符和ID ^B5678
在此條目後。 因此,你可能會忍不住認為,在已實現的 traits 陣列為ID 5678(因為它以 ^B
)。 但情況並非如此,因此您需要熟悉資料檔案的順序和結構。 即使實現 trait 陣列(或 CDF 檔案)開頭 ^A
,檔案中外觀或位置的順序定義陣列的開始。 並且,陣列中的第一元素總是通過 ^A
。
示例 CDF 檔案可能與以下內容類似。 我們已在此示例中插入換行符,以幫助它適應頁面。
下面的部分列出並定義 CDF 檔案名。
典型 CDF 檔案名包含下面列出的元素。 注意, 斜體 指示變數佔位符:
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
在 S3 儲存桶,檔案按合作夥伴ID(PID)、日和小時。
下表列出並定義 CDF 檔案名。
檔案名元素 | 說明 |
---|---|
|
這是AmazonS3伺服器上CDF檔案的預設根儲存桶。 |
|
保存CDF檔案的只讀S3儲存桶的名稱。 |
|
處理檔案的日期。 |
|
以24小時表示並在UTC時區中設定的時間值。 另請參見 客戶資料饋送檔案名時間和檔案內容時間……。 |
|
你的搭檔ID。 |
|
標識檔案序列的值。 序列增量如下:0_0_0,0_1_0,0_2_0....1_0_0 |
|
gzip檔案副檔名。 CDF檔案被gzip壓縮。 |
Audience Manager 寫 .info
檔案 S3 目錄,通知您 Customer Data File (CDF)已準備好下載。 的 .info
檔案也包括 JSON 格式化元資料,關於您的 CDF 的子菜單。 有關此通知檔案使用的語法和欄位的資訊,請查看本節。
每個 .info
檔案包含 Files
和 Totals
的子菜單。 的 Files
節包含一個陣列,該陣列保存每個小時檔案的特定度量。 的 Totals
部分包含所有 CDF 檔案。 您的 .info
檔案可能與以下示例類似。
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
下表列出並定義 CDF .info
的子菜單。
欄位 | 說明 |
---|---|
|
啟動包含有關CDF檔案的元資料的陣列。 |
|
檔案大小(以位元組為單位)。 |
|
AmazonS3 ETag 連字元後面的數字顯示在多部件上載期間用於生成檔案的部件數。 的 |
|
檔案名。 請參閱 客戶資料源檔案命名約定。 |
|
每個檔案的索引號。 |
欄位 | 說明 |
---|---|
|
啟動包含有關所有CDF檔案的聚合資料的對象。 |
|
資料可用的日期。 使用 yyyy-mm-dd 的子菜單。 |
|
資料可用的小時數。 使用UTC時區中設定的24小時格式。 |
|
該日期的所有CDF檔案的總大小(以位元組為單位)。 |
|
上載到S3目錄的檔案總數。 |
您 CDF 檔案包含檔案名和檔案內容中的時間戳。 這些時間戳記錄相同事件的不同進程 CDF 的子菜單。 在同一檔案的名稱和內容中看到不同的時間戳的情況並不少見。 瞭解每個時間戳有助於避免在處理此資料或嘗試按時間排序時出現的常見錯誤。
CDF 檔案在兩個不同位置記錄的時間不同。
下表提供了有關您的 CDF 檔案時間戳以及有關如何正確使用它們的資訊。
時間戳位置 | 說明 |
---|---|
檔案名稱 | 您的時間戳 CDF 檔案名標籤 Audience Manager 已開始準備檔案以供傳遞。 此時間戳在 UTC 時區。 它使用 hour= 參數,時間格式為2位小時,以24小時表示。 此時間可以不同於檔案內容中記錄的事件時間。 使用時 CDF 檔案,有時你會發現 S3 桶在特定小時內是空的。 空桶裝置可以表示以下任一種:
重要:不要使用檔案名時間戳按時間對事件進行分組。 如果需要按時間分組,請使用 EventTime 檔案內容中的時間戳。 |
檔案內容 | 您的時間戳 CDF 檔案內容標籤 Data Collection Servers 已開始處理檔案。 此時間戳在 UTC 時區。 它使用 EventTime 欄位,其格式為 yyyy-mm-dd hh:mm:ss 。 此時間接近頁面上事件的實際時間,但可能與檔案名中的小時指示器不同。 提示:與 hour= 在檔案名中,您可以使用 EventTime 按時間分組資料。 |