有關以下專案的基本資訊: Customer Data Feed (CDF)檔案和如何開始使用的說明。 如果您有興趣接收,請從這裡開始 CDF 檔案或只是想要更多資訊。
CDF 文件包含的数据与 Audience Manager 事件调用 (/event
) 发送到我们服务器的数据相同。这包括点赞用户 Id、 trait IDs 、 segment IDs 以及由事件调用捕获的所有其他参数的数据。 内部 Audience Manager 系统会将事件数据处理到一个 CDF 文件中,内容组织到按设置的顺序显示的字段中。 Audience Manager 嘗試產生 CDF 每小時都會建立檔案,並儲存在上安全、客戶特定的貯體中 Amazon S3 伺服器。 我們提供這些檔案,讓您可以 Audience Manager 資料超出使用者介面所設限制。
使用CDF檔案時,請注意下列限制:
沒有要啟動的自助服務程式 CDF 檔案傳送。 聯絡您的 Audience Manager 顧問或客戶服務人員開始使用。 實施期間,您的 Audience Manager 代表將:
檔案通知和 CDF 檔案將顯示在您的 S3 儲存貯體。 您負責監視和下載指派給您的檔案 S3 目錄。 请参阅客户数据信息源文件处理通知。
以下各節及 客戶資料摘要常見問題集 可協助您進一步熟悉此服務。
列出並定義中的資料元素和陣列 CDF 檔案,依外觀順序。 定義包含資料型別,但此資訊不是的一部分 CDF 檔案。
CDF設定預設會排除事件畫素。 如果您希望將事件畫素包含在CDF檔案中,請務必在傳送給客戶服務的請求中指定。 每個事件畫素都會填入CDF檔案中的唯一列。
A CDF 檔案包含下面定義的部分或全部欄位。 如需內部檔案組織的相關資訊,請參閱 客戶資料摘要檔案結構.
字段 | 数据类型 | 描述 |
---|---|---|
|
時間戳記 |
處理CDF檔案的時間 資料收集伺服器 (DCS)。 時間戳記會使用 yyyy-mm-dd hh:mm:ss 格式並設定為UTC時區。
注意:事件时间 不 是:
|
|
字符串 |
這是 不重複使用者ID (UUID),網站訪客的38位數裝置ID。 另请参阅 Audience Manager 中的 ID 索引。 |
|
数值 |
觸發ID同步的容器的ID。 只有當您在中設定容器ID時,此欄位才會填入 d_nsid 欄位。 否則,預設值0將不會包含在CDF檔案中。 |
|
數值陣列 |
一個特徵ID陣列,包含訪客在事件呼叫中實現(符合資格)的所有特徵。 請注意,陣列可包含訪客之前已符合資格的特徵,以及訪客透過此事件呼叫重新符合資格的特徵。 |
|
數值陣列 |
區段ID陣列,包含訪客在事件呼叫中實現(符合)的所有區段。 |
|
字符串 |
擷取所有引數(變數、ID、機碼值組、裝置廣告ID等)的字串。 已在事件呼叫中傳入。 簡短範例: |
|
字符串 |
反向链接页面的未编码 URL (如果有)。 |
|
字符串 |
訪客在事件呼叫中擷取的IP位址。 |
|
字符串 |
此 Experience Cloud 指派給網站訪客的ID (MID)。 另請參閱 Cookie與AdobeExperience Platform識別服務. |
|
數值陣列 |
區段ID陣列,包含訪客符合資格的先前實現區段和新區段。 |
|
數值陣列 |
第一方和第三方特徵ID陣列,包含訪客自上次產生資料摘要以來符合資格的先前實現的特徵和新特徵。 |
列出並定義 CDF 檔案。 这包括数据序列、字段分隔符和分隔符、数据文件映射和示例文件。
CDF 文件不包含已标记的列或字段标题。 相反, CDF 文件会定义包含非打印 ASCII 字符的字段和数组。 此外, CDF 檔案會以特定順序列出每個欄位和陣列。 瞭解欄位識別碼和順序將有助於您正確剖析檔案。
CDF檔案元素 | 描述 |
---|---|
欄位分隔符號和分隔符號 |
這些非列印字元定義CDF檔案的元素和結構:
|
欄位順序 |
重要: Audience Manager 保留在未來版本中在CDF檔案結尾新增新欄位的權利。 這表示檔案剖析系統的技術設計不應假設欄數固定(雖然它可能假設現有欄的順序固定)。 CDF檔案中的資料會以下列順序顯示。/N可以取代這些欄位中的任何一個,表示null值。
如需欄位說明,請參閱 已定義客戶資料摘要內容. |
CDF 文件数据按下面显示的顺序显示。
文件中 CDF 的数组开始并以 Ctrl + a
字段分隔符结尾。 这会使数组中的第一个元素显示点赞独立的数据字段。 例如,已实现 traits 的数组以开头 ^A1234
。 陣列分隔符號和ID ^B5678
會依循此專案。 因此,您可能會覺得已實現中的第一個元素 traits 陣列識別碼為5678 (因為它開頭為 ^B
)。 但事實並非如此,因此您需要熟悉資料檔案的順序和結構。 即使已實現中的第一個元素 trait 陣列(或中任何其他陣列) CDF file)開頭為 ^A
中,檔案中的外觀或位置順序會定義陣列的開頭。 而且,陣列中的第一個元素一律會與前一個專案分開,分隔方式如下 ^A
.
範例 CDF 檔案可能類似於以下內容。 我們在此範例中插入了分行符號,以協助它符合頁面。
以下各節列出並定義中的元素 CDF 檔案名稱。
典型 CDF 檔案名稱包含下列元素。 注意, 斜體 表示變數預留位置:
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
在您的 S3 儲存貯體,檔案會依合作夥伴ID (PID)、日和小時。
下表列出并定义了文件名中 CDF 的元素。
文件名称元素 | 描述 |
---|---|
|
這是Amazon S3伺服器上CDF檔案的預設根儲存貯體。 |
|
儲存CDF檔案的唯讀S3儲存貯體名稱。 |
|
處理您的檔案的日期。 |
|
以24小時標籤法表示並以UTC時區設定的時間值。 另請參閱 客戶資料摘要檔案名稱時間與檔案內容時間……. |
|
您的合作夥伴ID。 |
|
識別檔案序列的值。 序列增量如下: 0_0_0 、 0_1_0 、 0_2_0....1_0_0 |
|
gzip副檔名。 CDF檔案會以gzip壓縮。 |
Audience Manager 寫入 .info
檔案至您的 S3 目錄,通知您何時使用 Customer Data File (CDF)已可供下載。 此 .info
檔案也包含 JSON 有關您檔案內容的格式化中繼資料 CDF 檔案。 有关此通知文件使用的语法和字段的信息,请查看此部分。
每个文件都 .info
包含一个 Files
和 Totals
部分。 该 Files
区域包含一个数组,用于保存每小时文件的特定量度。 此 Totals
區段包含所有量度彙總 CDF 特定日期的檔案。 您的網站內容 .info
檔案看起來可能類似於以下範例。
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
下表列出並定義 CDF .info
檔案。
字段 | 描述 |
---|---|
|
啟動包含CDF檔案中繼資料的陣列。 |
|
檔案大小(位元組)。 |
|
Amazon S3 ETag。 連字型大小後面的數字顯示了在多部分上傳期間用來建置檔案的部分的數量。 此 |
|
檔案名稱。 另請參閱 客戶資料摘要檔案命名慣例. |
|
每個檔案的索引編號。 |
字段 | 描述 |
---|---|
|
啟動包含所有CDF檔案之彙總資料的物件。 |
|
資料可用的日期。 使用 yyyy-mm-dd 格式。 |
|
有資料可用的小時。 使用UTC時區設定的24小時格式。 |
|
該日期所有CDF檔案的總大小(以位元組為單位)。 |
|
上傳至S3目錄的檔案總數。 |
您的 CDF 檔案包含檔案名稱和檔案內容的時間戳記。 這些時間戳記會針對相同專案記錄不同的事件程式 CDF 檔案。 在同一個檔案的名稱和內容中看到不同的時間戳記是很常見的現象。 瞭解每個時間戳記可協助您在使用此資料或嘗試依時間排序資料時避免常見錯誤。
CDF 檔案在2個不同的位置記錄時間的方式不同。
下表提供您專屬的 CDF 檔案時間戳記以及如何正確使用的相關資訊。
時間戳記位置 | 描述 |
---|---|
文件名 | 中的時間戳記 CDF 檔案名稱會標籤時間: Audience Manager 已開始準備檔案以進行傳送。 此時間戳記設定於 UTC 時區。 它會使用 hour= 引數,時間格式為24小時標籤法的2位數小時。 此時間可能與檔案內容中記錄的事件時間不同。 使用時 CDF 檔案,有時您會注意到 S3 值區在特定小時內為空白。 空白貯體表示可能有下列其中一種情況:
重要:請勿使用檔案名稱時間戳記,依時間將事件分組。 如果您需要依時間分組,請使用 EventTime 檔案內容中的時間戳記。 |
檔案內容 | 中的時間戳記 CDF 檔案內容會標籤時間 Data Collection Servers 已開始處理檔案。 此時間戳記設定於 UTC 時區。 它會使用 EventTime 欄位,時間格式為 yyyy-mm-dd hh:mm:ss . 此时间与页面中事件的实际时间接近,但它可以不同于文件名中的小时指示器。 提示 :与文件名中的 hour= 时间戳不同,您可以 EventTime 按时间群组数据。 |