Customer Data Feeds customer-data-feeds
有關以下專案的基本資訊: Customer Data Feed (CDF)檔案和如何開始使用的說明。 如果您有興趣接收,請從這裡開始 CDF 檔案或只是想要更多資訊。
文件内容和目的 file-contents-purpose
CDF 文件包含的数据与 Audience Manager 事件调用 (/event
) 发送到我们服务器的数据相同。这包括点赞用户 Id、 trait IDs 、 segment IDs 以及由事件调用捕获的所有其他参数的数据。 内部 Audience Manager 系统会将事件数据处理到一个 CDF 文件中,内容组织到按设置的顺序显示的字段中。 Audience Manager 嘗試產生 CDF 每小時都會建立檔案,並儲存在上安全、客戶特定的貯體中 Amazon S3 伺服器。 我們提供這些檔案,讓您可以 Audience Manager 資料超出使用者介面所設限制。
- 設定CDF檔案傳送之前,請確定您擁有來自第三方資料提供者的適當許可權,可匯出第三方特徵。 Audience Manager目前不支援使用者介面中的功能,無法向協力廠商資料提供者要求CDF檔案傳遞匯出許可權,因此請單獨與他們聯絡。
- 您不應使用 CDF 檔案作為Proxy來監控頁面流量、協調報表差異或計費等。
入门指南 getting-started
沒有要啟動的自助服務程式 CDF 檔案傳送。 聯絡您的 Audience Manager 顧問或客戶服務人員開始使用。 實施期間,您的 Audience Manager 代表將:
- 設定您的 Amazon S3 儲存貯體。
- 提供唯讀 S3 檔案儲存貯體的驗證認證。 您將無法檢視或存取其他客戶的目錄和檔案。
檔案通知和 CDF 檔案將顯示在您的 S3 儲存貯體。 您負責監視和下載指派給您的檔案 S3 目錄。 请参阅客户数据信息源文件处理通知。
后续步骤 next-steps
以下各節及 客戶資料摘要常見問題集 可協助您進一步熟悉此服務。
Customer Data Feed 已定義內容 cdf-defined
列出並定義中的資料元素和陣列 CDF 檔案,依外觀順序。 定義包含資料型別,但此資訊不是的一部分 CDF 檔案。
定义 definitions
A CDF 檔案包含下面定義的部分或全部欄位。 如需內部檔案組織的相關資訊,請參閱 客戶資料摘要檔案結構.
Event Time
處理CDF檔案的時間 資料收集伺服器 (DCS)。 時間戳記會使用 yyyy-mm-dd hhss 格式並設定為UTC時區。
注意:事件时间 不 是:
- 页面事件或事件调用自身的时间,尽管可能接近这些时间。
- 与文件名中的 DC 小时相关。 另请参阅客户数据馈送文件名称和文件内容时间 ...。
Container ID
Realized Traits
一個特徵ID陣列,包含訪客在事件呼叫中實現(符合資格)的所有特徵。
請注意,陣列可包含訪客之前已符合資格的特徵,以及訪客透過此事件呼叫重新符合資格的特徵。
Realized Segments
Request Parameters
擷取所有引數(變數、ID、機碼值組、裝置廣告ID等)的字串。 已在事件呼叫中傳入。
簡短範例:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
IP Data Type
All Segments
All Traits
Customer Data Feed 檔案結構 cdf-file-structure
列出並定義 CDF 檔案。 这包括数据序列、字段分隔符和分隔符、数据文件映射和示例文件。
数据字段标识符和序列 identifiers-and-sequence
CDF 文件不包含已标记的列或字段标题。 相反, CDF 文件会定义包含非打印 ASCII 字符的字段和数组。 此外, CDF 檔案會以特定順序列出每個欄位和陣列。 瞭解欄位識別碼和順序將有助於您正確剖析檔案。
這些非列印字元定義CDF檔案的元素和結構:
- Ctrl + a (ASCII)
001
或^A
)會以非列印用的空格指示器分隔個別欄位中的資料。 - Ctrl + b (ASCII)
002
或^B
)將資料分隔為陣列和要求引數。 - Ctrl + c (ASCII)
003
或^C
)會定義機碼值組。
重要: Audience Manager 保留在未來版本中在CDF檔案結尾新增新欄位的權利。 這表示檔案剖析系統的技術設計不應假設欄數固定(雖然它可能假設現有欄的順序固定)。
CDF檔案中的資料會以下列順序顯示。/N可以取代這些欄位中的任何一個,表示null值。
- 事件時間
- 设备
- 容器 ID
- 已實現的特徵
- 已實現的區段
- 请求参数
- Referer
- IP 地址
- Experience Cloud裝置ID (或MID)。 另請參閱 Cookie與Adobe Experience Platform Identity服務
- 所有區段
- 所有特徵
如需欄位說明,請參閱 已定義客戶資料摘要內容.
CDF 檔案地圖 cdf-file-map
CDF 文件数据按下面显示的顺序显示。
识别数组
文件中 CDF 的数组开始并以 Ctrl + a
字段分隔符结尾。 这会使数组中的第一个元素显示点赞独立的数据字段。 例如,已实现 traits 的数组以开头 ^A1234
。 陣列分隔符號和ID ^B5678
會依循此專案。 因此,您可能會覺得已實現中的第一個元素 traits 陣列識別碼為5678 (因為它開頭為 ^B
)。 但事實並非如此,因此您需要熟悉資料檔案的順序和結構。 即使已實現中的第一個元素 trait 陣列(或中任何其他陣列) CDF file)開頭為 ^A
中,檔案中的外觀或位置順序會定義陣列的開頭。 而且,陣列中的第一個元素一律會與前一個專案分開,分隔方式如下 ^A
.
範例 CDF 檔案 sample-file
範例 CDF 檔案可能類似於以下內容。 我們在此範例中插入了分行符號,以協助它符合頁面。
Customer Data Feed 檔案命名慣例 cdf-naming-conventions
以下各節列出並定義中的元素 CDF 檔案名稱。
CDF 檔案名稱:語法和範例 cdf-file-name
典型 CDF 檔案名稱包含下列元素。 注意, 斜體 表示變數預留位置:
语法
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
示例
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
在您的 S3 儲存貯體,檔案會依合作夥伴ID (PID)、日和小時。
CDF 已定義的檔案名稱元素 cdf-file-name-elements
下表列出并定义了文件名中 CDF 的元素。
s3://aam-cdf/
your S3 bucket name
day=yyyy-mm-dd
hour=hh
partner ID
File Sequence_0
.gz
Customer Data Feed 檔案處理通知 cdf-file-processing-notifications
Audience Manager 寫入 .info
檔案至您的 S3 目錄,通知您何時使用 Customer Data File (CDF)已可供下載。 此 .info
檔案也包含 JSON 有關您檔案內容的格式化中繼資料 CDF 檔案。 有关此通知文件使用的语法和字段的信息,请查看此部分。
示例信息文件 sample-info-file
每个文件都 .info
包含一个 Files
和 Totals
部分。 该 Files
区域包含一个数组,用于保存每小时文件的特定量度。 此 Totals
區段包含所有量度彙總 CDF 特定日期的檔案。 您的網站內容 .info
檔案看起來可能類似於以下範例。
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
已定義的資訊檔案欄位 info-file-fields-defined
下表列出並定義 CDF .info
檔案。
檔案物件
Files
FileByteSize
FileChecksumMD5
ETag
與檔案的MD5總和檢查碼不相同。FileName
FileSequenceNumber
總計物件
Totals
Day
Hour
TotalByteSize
TotalNumberFiles
Customer Data Feed 檔案名稱時間與檔案內容時間不同 different-processing-times
您的 CDF 檔案包含檔案名稱和檔案內容的時間戳記。 這些時間戳記會針對相同專案記錄不同的事件程式 CDF 檔案。 在同一個檔案的名稱和內容中看到不同的時間戳記是很常見的現象。 瞭解每個時間戳記可協助您在使用此資料或嘗試依時間排序資料時避免常見錯誤。
定位 CDF 檔案時間戳記 locating-timestamps
CDF 檔案在2個不同的位置記錄時間的方式不同。
瞭解時間戳記之間的差異 understanding-timestamps
下表提供您專屬的 CDF 檔案時間戳記以及如何正確使用的相關資訊。
中的時間戳記 CDF 檔案名稱會標籤時間: Audience Manager 已開始準備檔案以進行傳送。 此時間戳記設定於 UTC 時區。 它會使用 hour=
引數,時間格式為24小時標籤法的2位數小時。 此時間可能與檔案內容中記錄的事件時間不同。 使用時 CDF 檔案,有時您會注意到 S3 值區在特定小時內為空白。 空白貯體表示可能有下列其中一種情況:
- 沒有該特定小時的資料。
- 我們的伺服器負載過重,無法在特定小時內處理檔案。 當伺服器趕上進度時,會將原本應該放在較早時段檔案中的檔案放入具有較晚時間值的貯體中。 例如,當應在17小時貯體中的檔案出現在18小時貯體時(具有
hour=18
(在檔案名稱中)。 在這種情況下,伺服器可能在17小時內開始處理您的檔案,但無法在該時間間隔內完成它。 相反地,檔案會推送至下一個每小時時段。
重要:請勿使用檔案名稱時間戳記,依時間將事件分組。 如果您需要依時間分組,請使用 EventTime
檔案內容中的時間戳記。
EventTime
欄位,時間格式為 yyyy-mm-dd hh:mm:ss
. 此时间与页面中事件的实际时间接近,但它可以不同于文件名中的小时指示器。提示 :与文件名中的
hour=
时间戳不同,您可以 EventTime
按时间群组数据。