Customer Data Feeds

有關 Customer Data Feed (CDF)檔案和有關如何開始的說明。 如果您有興趣接收 CDF 檔案或只是想要更多資訊。

檔案內容和用途

CDF 檔案包含的資料與 Audience Manager 事件呼叫 (/event) 傳送至我們伺服器的資料相同。包括用戶ID等資料, trait IDs。 segment IDs,以及事件調用捕獲的所有其他參數。 內部 Audience Manager 系統將事件資料處理到 CDF 檔案,其內容組織為按設定順序顯示的欄位。 Audience Manager 嘗試生成 CDF 每小時歸檔,並將它們儲存在一個安全、特定於客戶的儲存桶中 Amazon S3 伺服器。 我們提供這些檔案,以便您能夠 Audience Manager 超出用戶介面限制的資料。

重要

使用CDF檔案時請注意以下限制:

  • 在設定CDF檔案傳送之前,請確保您具有第三方資料提供商對導出第三方特徵的適當權限。 Audience Manager當前不支援用戶介面中向第三方資料提供程式請求CDF檔案傳遞導出權限的功能,因此請獨立聯繫他們。
  • 你不該 CDF 檔案作為代理來監視頁流量、協調報表差異或計費等。

快速入門

沒有要啟動的自助服務進程 CDF 檔案傳遞。 聯繫您 Audience Manager 咨詢顧問或客戶服務開始。 在實施過程中, Audience Manager 代表:

  • 設定 Amazon S3 儲存桶。
  • 提供只讀 S3 檔案儲存儲存桶的身份驗證憑據。 您將無法查看或訪問屬於其他客戶的目錄和檔案。

檔案通知和 CDF 檔案將出現在 S3 當它們準備下載時儲存。 您負責監視和下載分配的檔案 S3 的子菜單。 請參閱客戶資料摘要檔案處理通知

後續步驟

以下各節和 客戶資料源常見問題 可以幫助您更熟悉此服務。

Customer Data Feed 定義的內容

列出並定義 CDF 按外觀順序排列。 定義包括資料類型,但此資訊不是 CDF 的子菜單。

定義

A CDF 檔案包含下面定義的部分或全部欄位。 有關內部檔案組織的資訊,請參見 客戶資料饋送檔案結構

欄位 資料類型 說明

Event Time

時間戳

CDF檔案由 資料收集伺服器 (DCS)。 時間戳使用 yyyy-mm-dd hh:mm:ss 格式,並在UTC時區中設定。

注:事件時間 不是:

Device

字串

這是 唯一用戶ID (UUID),是站點訪問者的38位設備ID。 也請參閱 Audience Manager 內的 ID 索引

Container ID

數值

觸發ID同步的容器的ID。

Realized Traits

數字陣列

一組特性ID,包含訪問者在事件調用中實現(限定)的所有特性。

請注意,陣列可以包含訪問者以前已通過此事件調用確認的特徵,以及通過此事件調用重新確認這些特徵。

Realized Segments

數字陣列

一組段ID,包含訪問者在事件調用中實現(限定)的所有段。

Request Parameters

字串

捕獲所有參數(變數、ID、鍵值對、設備通告ID等)的字串 在事件呼叫中傳入。

縮寫示例:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type

字串

引用頁的未編碼URL(如果有)。

IP Data Type

字串

在事件調用中捕獲的訪問者的IP地址。

MCDevice

字串

Experience Cloud 分配給站點訪問者的ID(MID)。 另請參見 Cookie和AdobeExperience Platform標識服務

All Segments

數字陣列

一組段ID,包含先前實現的段和訪問者限定的新段。

All Traits

數字陣列

一組第一和第三方特性ID,包含訪問者自上次生成資料饋送以來所限定的先前實現的特性和新特性。

Customer Data Feed 檔案結構

列出並定義 CDF 的子菜單。 這包括資料序列、欄位分隔符和分隔符、資料檔案映射和示例檔案。

資料欄位標識符和序列

CDF 檔案不包含已標籤的列或欄位標題。 相反, CDF 檔案定義欄位和陣列,但不打印 ASCII 字元。 另外, CDF 檔案按特定順序列出每個欄位和陣列。 瞭解欄位標識符和順序將幫助您正確分析檔案。

CDF檔案元素 說明

欄位分隔符和分隔符

這些非打印字元定義CDF檔案的元素和結構:

  • Ctrl + a(ASCII) 001 ^A)使用非打印空間指示器分隔各個欄位中的資料。
  • Ctrl + b(ASCII) 002 ^B)分離資料和陣列和請求參數。
  • Ctrl + c(ASCII) 003 ^C)定義鍵值對。

欄位序列

重要提示: Audience Manager 保留在將來版本中將新欄位添加到CDF檔案末尾的權利。 這意味著檔案分析系統的技術設計不應假定列數固定(儘管它可能假定現有列的順序固定)。

CDF檔案中的資料按如下所示的順序顯示。/N可能會代替這些欄位中的任何一個,表示空值。

  1. 事件時間
  2. 裝置
  3. 容器 ID
  4. 已實現的特性
  5. 已實現的段
  6. 要求參數
  7. Referer
  8. IP 位址
  9. Experience Cloud設備ID(或MID)。 另請參見 Cookie和Adobe Experience Platform身份服務
  10. 所有段
  11. 所有特徵

有關欄位說明,請參見 已定義客戶資料饋送內容

CDF 檔案映射

CDF 檔案資料按如下所示的順序顯示。

識別陣列

在 CDF 檔案以開頭和結尾 Ctrl + a 欄位分隔符。 這使陣列中的第一個元素看起來像獨立資料欄位。 例如, traits 陣列開始於 ^A1234。 陣列分隔符和ID ^B5678 在此條目後。 因此,你可能會忍不住認為,在已實現的 traits 陣列為ID 5678(因為它以 ^B)。 但情況並非如此,因此您需要熟悉資料檔案的順序和結構。 即使實現 trait 陣列(或 CDF 檔案)開頭 ^A,檔案中外觀或位置的順序定義陣列的開始。 並且,陣列中的第一元素總是通過 ^A

示例 CDF 檔案

示例 CDF 檔案可能與以下內容類似。 我們已在此示例中插入換行符,以幫助它適應頁面。

Customer Data Feed 檔案命名約定

下面的部分列出並定義 CDF 檔案名。

CDF 檔案名:語法和示例

典型 CDF 檔案名包含下面列出的元素。 注意, 斜體 指示變數佔位符:

語法

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

範例

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

在 S3 儲存桶,檔案按合作夥伴ID(PID)、日和小時。

CDF 定義的檔案名元素

下表列出並定義了 CDF 檔案名。

檔案名元素 說明

s3://aam-cdf/

這是AmazonS3伺服器上CDF檔案的預設根儲存桶。

your S3 bucket name

保存CDF檔案的只讀S3儲存桶的名稱。

day=yyyy-mm-dd

處理檔案的日期。

hour=hh

以24小時表示並在UTC時區中設定的時間值。 另請參見 客戶資料饋送檔案名時間和檔案內容時間……

partner ID

你的搭檔ID。

File Sequence_0

標識檔案序列的值。 序列增量如下:0_0_0,0_1_0,0_2_0....1_0_0

.gz

gzip檔案副檔名。 CDF檔案被gzip壓縮。

Customer Data Feed 檔案處理通知

Audience Manager 寫 .info 檔案 S3 目錄,通知您 Customer Data File (CDF)已準備好下載。 的 .info 檔案也包括 JSON 格式化元資料,關於您的 CDF 的子菜單。 有關此通知檔案使用的語法和欄位的資訊,請查看本節。

示例資訊檔案

每個 .info 檔案包含 FilesTotals 的子菜單。 的 Files 節包含一個陣列,該陣列保存每個小時檔案的特定度量。 的 Totals 部分包含所有 CDF 檔案。 您的 .info 檔案可能與以下示例類似。

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

定義的資訊檔案欄位

下表列出並定義 CDF .info 的子菜單。

檔案對象

欄位 說明

Files

啟動包含有關CDF檔案的元資料的陣列。

FileByteSize

檔案大小(以位元組為單位)。

FileChecksumMD5

AmazonS3 ETag 連字元後面的數字顯示在多部件上載期間用於生成檔案的部件數。 的 ETag 與檔案的MD5校驗和不相同。

FileName

檔案名。 請參閱 客戶資料源檔案命名約定

FileSequenceNumber

每個檔案的索引號。

總計對象

欄位 說明

Totals

啟動包含有關所有CDF檔案的聚合資料的對象。

Day

資料可用的日期。 使用 yyyy-mm-dd 的子菜單。

Hour

資料可用的小時數。 使用UTC時區中設定的24小時格式。

TotalByteSize

該日期的所有CDF檔案的總大小(以位元組為單位)。

TotalNumberFiles

上載到S3目錄的檔案總數。

Customer Data Feed 檔案名時間和檔案內容時間不同

您 CDF 檔案包含檔案名和檔案內容中的時間戳。 這些時間戳記錄相同事件的不同進程 CDF 的子菜單。 在同一檔案的名稱和內容中看到不同的時間戳的情況並不少見。 瞭解每個時間戳有助於避免在處理此資料或嘗試按時間排序時出現的常見錯誤。

定位 CDF 檔案時間戳

CDF 檔案在兩個不同位置記錄的時間不同。

理解時間戳的區別

下表提供了有關您的 CDF 檔案時間戳以及有關如何正確使用它們的資訊。

時間戳位置 說明
檔案名稱 您的時間戳 CDF 檔案名標籤 Audience Manager 已開始準備檔案以供傳遞。 此時間戳在 UTC 時區。 它使用 hour= 參數,時間格式為2位小時,以24小時表示。 此時間可以不同於檔案內容中記錄的事件時間。 使用時 CDF 檔案,有時你會發現 S3 桶在特定小時內是空的。 空桶裝置可以表示以下任一種:
  • 沒有那個小時的資料。
  • 我們的伺服器負載很重,無法處理特定小時的檔案。 當伺服器趕上時,它會將本應放在較早時段檔案中的檔案放入具有稍後時間值的儲存桶中。 例如,在18小時儲存桶中出現本應在17小時儲存桶中的檔案時,您會看到這一點(帶 hour=18 的子菜單。 在這種情況下,伺服器可能在17小時內開始處理您的檔案,但無法在該時間間隔內完成。 相反,檔案會被推入到下一個小時時段。

重要:不要使用檔案名時間戳按時間對事件進行分組。 如果需要按時間分組,請使用 EventTime 檔案內容中的時間戳。
檔案內容 您的時間戳 CDF 檔案內容標籤 Data Collection Servers 已開始處理檔案。 此時間戳在 UTC 時區。 它使用 EventTime 欄位,其格式為 yyyy-mm-dd hh:mm:ss。 此時間接近頁面上事件的實際時間,但可能與檔案名中的小時指示器不同。
提示:與 hour= 在檔案名中,您可以使用 EventTime 按時間分組資料。

本頁內容