有關Customer Data Feed (CDF)檔案的基本資訊以及如何開始使用的指示。 如果您想要接收CDF檔案,或只想要更多資訊,請從這裡開始。
CDF 檔案包含的資料與 Audience Manager 事件呼叫 (/event
) 傳送至我們伺服器的資料相同。這包括使用者ID、trait IDs、segment IDs等資料,以及事件呼叫所擷取的所有其他參數。 內部Audience Manager系統將事件資料處理為CDF檔案,內容會組織為依固定順序顯示的欄位。 Audience Manager 嘗試每小時產 CDF 生檔案,並將它們儲存在伺服器上安全、客戶專屬的儲 Amazon S3 存貯體。我們提供這些檔案,讓您能夠處理Audience Manager資料,不受使用者介面的限制。
使用CDF檔案時請注意以下限制:
沒有啟動CDF檔案傳送的自助服務進程。 請連絡您的Audience Manager顧問或客戶服務以開始使用。 在實施期間,您的Audience Manager代表將:
當檔案通知和CDF檔案準備好下載時,會出現在您的S3儲存貯體中。 您負責從您指派的S3目錄監視和下載檔案。 請參閱客戶資料摘要檔案處理通知。
以下各節和客戶資料饋送常見問答集可協助您更熟悉這項服務。
按外觀順序列出並定義CDF檔案中的資料元素和陣列。 定義包括資料類型,但此資訊不屬於CDF檔案。
CDF檔案包含下面定義的部分或全部欄位。 如需內部檔案組織的詳細資訊,請參閱客戶資料饋送檔案結構。
欄位 | 資料類型 | 說明 |
---|---|---|
|
時間戳記 |
資料收集伺服器(DCS)處理CDF檔案的時間。 時間戳記使用yyyy-mm-dd hh:mm:ss格式,並在UTC時區中設定。
注意:事件時間不是:
|
|
字串 |
這是唯一使用者ID(UUID),是您網站訪客的38位元裝置ID。 也請參閱 Audience Manager 內的 ID 索引。 |
|
數值 |
觸發ID的容器ID同步。 |
|
數值陣列 |
一組特徵ID,包含訪客在事件呼叫中實現(符合)的所有特徵。 請注意,陣列可包含訪客在此事件呼叫前曾符合的特徵,以及重新符合的特徵。 |
|
數值陣列 |
區段ID的陣列,包含訪客在事件呼叫中實現(符合)的所有區段。 |
|
字串 |
擷取所有參數(變數、ID、索引鍵值配對、裝置廣告ID等)的字串 在事件呼叫時傳入。 縮短範例: |
|
字串 |
反向連結頁面的未編碼URL(如果有)。 |
|
字串 |
在事件呼叫中擷取之訪客的IP位址。 |
|
字串 |
指派給網站訪客的 Experience Cloud ID(MID)。 另請參閱 Cookie和Adobe Experience Platform Identity Service。 |
|
數值陣列 |
區段ID的陣列,包含先前已實現的區段和訪客符合的新區段。 |
|
數值陣列 |
一系列第一方和第三方特徵ID,其中包含訪客自上次產生資料饋送以來所符合的先前實現特徵和新特徵。 |
列出並定義CDF檔案的資料結構。 這包括資料順序、欄位分隔字元和分隔符號、資料檔案地圖和範例檔案。
CDF 檔案不包含已標示的欄或欄位標題。相反,CDF檔案定義了欄位和陣列,這些欄位和陣列不打印ASCII字元。 此外,CDF檔案還按特定順序列出每個欄位和陣列。 瞭解欄位識別碼和順序有助於正確剖析檔案。
CDF檔案元素 | 說明 |
---|---|
欄位分隔符和分隔字元 |
這些非打印字元定義CDF檔案的元素和結構:
|
欄位順序 |
重要: Audience Manager保留在未來發行版本中新增欄位至CDF檔案結尾的權利。 這表示檔案剖析系統的技術設計不應假設固定數目的欄(雖然它可能會假設現有欄的順序固定)。 CDF檔案中的資料按以下順序顯示。
如需欄位說明,請參閱客戶資料饋送內容定義。 |
CDF 檔案資料會依下列順序顯示。
CDF檔案中的陣列以Ctrl + a
欄位分隔符開始和結束。 這會使陣列中的第一個元素看起來像獨立的資料欄位。 例如,實現的traits陣列以^A1234
開頭。 陣列分隔字元和ID ^B5678
會遵循此項目。 因此,您可能會想到實現的traits陣列中的第一個元素是ID 5678(因為它以^B
開頭)。 但情況並非如此,因此您需要熟悉資料檔案的順序和結構。 即使實現的trait陣列(或CDF檔案中的任何其它陣列)中的第一個元素以^A
開頭,檔案中的外觀或位置順序仍定義了陣列的開頭。 而且,陣列中的第一個元素始終由^A
與前一個條目分開。
範例CDF檔案看起來可能類似下列。 我們在此範例中插入了分行符號,以協助它符合頁面。
以下各節列出並定義CDF檔案名稱中的元素。
典型的CDF檔案名包含下列元素。 請注意,斜體字表示變數預留位置:
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF-PARTNER-ID-AAM PROCESS-ID_0.gz
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_000058_0.gz
在您的S3儲存貯體中,檔案會依合作夥伴ID(PID)、日和小時的遞增順序排序。
下表列出並定義CDF檔案名稱中的元素。
檔案名稱元素 | 說明 |
---|---|
|
這是Amazon S3伺服器上CDF檔案的預設根儲存桶。 |
|
唯讀儲存桶的名稱,保存CDF檔案的S3儲存桶。 |
|
您檔案的處理日期。 |
|
以24小時記號表示並在UTC時區中設定的時間值。 另請參閱客戶資料饋送檔案名稱時間和檔案內容時間……。 |
|
您的合作夥伴ID。 |
|
內部 Audience Manager程式ID。 |
|
gzip副檔名。 CDF檔案壓縮為gzip。 |
Audience Manager 將檔 .info
案寫入 S3 您的目錄,以告知您 Customer Data File (CDF)已準備下載。.info
檔案也包含有關CDF檔案內容的JSON格式化中繼資料。 請檢閱本節,以取得有關此通知檔案所使用之語法和欄位的資訊。
每個.info
檔案都包含Files
和Totals
區段。 Files
區段包含一個陣列,其中包含每個每小時檔案的特定度量。 Totals
區段包含特定日期所有CDF檔案的匯總量度。 .info
檔案的內容看起來可能類似下列範例。
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
下表列出並定義CDF .info
檔案中的元素。
欄位 | 說明 |
---|---|
|
啟動包含有關CDF檔案的元資料的陣列。 |
|
檔案大小(以位元組為單位)。 |
|
Amazon S3 ETag。 連字型大小後面的數字顯示在多部件上載期間用於生成檔案的部件數。 |
|
檔案名。 請參閱客戶資料饋送檔案命名慣例。 |
|
每個檔案的索引號。 |
欄位 | 說明 |
---|---|
|
啟動包含所有CDF檔案的聚合資料的對象。 |
|
資料可用的日期。 使用yyyy-mm-dd格式。 |
|
資料可用的小時數。 使用在UTC時區中設定的24小時格式。 |
|
該日期所有CDF檔案的總大小(以位元組為單位)。 |
|
上傳到S3目錄的檔案總數。 |
您的CDF檔案在檔案名稱和檔案內容中包含時間戳記。 這些時間戳記會記錄相同CDF檔案的不同事件進程。 相同檔案的名稱和內容中會出現不同的時間戳記,這種情況並不少見。 瞭解每個時間戳記有助於您避免在處理此資料或嘗試依時間排序時常出錯。
CDF 檔案在2個不同位置記錄的時間不同。
下表提供有關CDF檔案時間戳記的其他詳細資訊,以及如何正確使用時間戳記的資訊。
時間戳記位置 | 說明 |
---|---|
檔案名稱 | CDF檔案名稱中的時間戳記會標示Audience Manager開始準備傳送檔案的時間。 此時間戳記設定在UTC時區中。 它使用hour= 參數,時間格式化為24小時記號的2位數小時。 此時間可以與檔案內容中記錄的事件時間不同。 使用CDF檔案時,有時您會發現您的S3儲存貯體在特定小時內是空的。 空桶表示可以表示以下任一項:
重要:請勿使用檔案名稱時間戳記依時間來分組事件。如果需要按時間分組,請使用檔案內容中的 EventTime 時間戳記。 |
檔案內容 | CDF檔案內容中的時間戳記會標示Data Collection Servers開始處理檔案的時間。 此時間戳記設定在UTC時區中。 它使用EventTime 欄位,時間格式為yyyy-mm-dd hh:mm:ss 。 此時間接近頁面上事件的實際時間,但可能與檔案名稱中的小時指示符不同。提示:與檔案 hour= 名稱中的時間戳記不同,您可 EventTime 以用來依時間分組資料。 |