Customer Data Feeds

關於Customer Data Feed (CDF)檔案的基本資訊以及如何開始的說明。 如果您想要接收CDF檔案,或只是想要詳細資訊,請從這裡開始。

檔案內容和用途

CDF 檔案包含的資料與 Audience Manager 事件呼叫 (/event) 傳送至我們伺服器的資料相同。這包括使用者ID、trait IDs、segment IDs等資料,以及事件呼叫所擷取的所有其他參數。 內部Audience Manager系統將事件資料處理為CDF檔案,其中內容按照設定順序排列為以欄位。 Audience Manager 會嘗試每小時 CDF 產生檔案,並將檔案儲存在伺服器上安全、客戶專屬的貯 Amazon S3 體中。我們提供這些檔案,以便您能夠處理Audience Manager資料,而不受用戶介面的限制。

重要

使用CDF檔案時,請注意下列限制:

  • 在設定CDF檔案傳送之前,請確定您擁有來自協力廠商資料提供者的適當權限,以匯出協力廠商特徵。 Audience Manager目前不支援向第三方資料提供者要求CDF檔案傳送匯出權限的使用者介面功能,因此請單獨聯絡他們。
  • 您不應將CDF檔案當作代理來監控頁面流量、調解報表差異或進行帳單等。

快速入門

沒有可啟動CDF檔案傳送的自助程式。 請連絡您的Audience Manager顧問或客戶服務以開始使用。 實作期間,您的Audience Manager代表將:

  • 設定您的Amazon S3儲存貯體。
  • 為檔案儲存貯體提供唯讀S3驗證憑證。 您將無法查看或訪問屬於其他客戶的目錄和檔案。

檔案通知和CDF檔案將在準備下載時顯示在您的S3儲存貯體中。 您負責從指派的S3目錄監視和下載檔案。 請參閱客戶資料摘要檔案處理通知

後續步驟

以下各節和客戶資料摘要常見問題集可協助您更熟悉此服務。

Customer Data Feed 定義的內容

按外觀順序列出並定義CDF檔案中的資料元素和陣列。 定義包含資料類型,但此資訊不屬於CDF檔案。

定義

CDF檔案包含以下定義的部分或全部欄位。 如需內部檔案組織的相關資訊,請參閱客戶資料摘要檔案結構

欄位 資料類型 說明

Event Time

時間戳記

資料收集伺服器(DCS)處理CDF檔案的時間。 時間戳記使用yyyy-mm-dd hh:mm:ss格式,並以UTC時區設定。

注意:事件時間不是:

Device

字串

這是不重複使用者ID(UUID),這是網站訪客的38位數裝置ID。 也請參閱 Audience Manager 內的 ID 索引

Container ID

數值

觸發ID之容器的ID會同步。

Realized Traits

數值陣列

特徵ID陣列,包含訪客在事件呼叫中實現(符合資格)的所有特徵。

請注意,陣列可包含訪客之前已符合資格的特徵,以及透過此事件呼叫重新符合資格的特徵。

Realized Segments

數值陣列

區段ID的陣列,包含訪客在事件呼叫中實現(符合資格)的所有區段。

Request Parameters

字串

擷取所有參數(變數、ID、索引鍵值配對、裝置廣告ID等)的字串 在事件呼叫時傳入。

簡短範例:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type

字串

反向連結頁面的未編碼URL(如果有)。

IP Data Type

字串

在事件呼叫中擷取之訪客的IP位址。

MCDevice

字串

指派給網站訪客的Experience Cloud ID(MID)。 另請參閱 Cookie和AdobeExperience PlatformIdentity服務

All Segments

數值陣列

區段ID的陣列,包含先前實現的區段和訪客符合資格的新區段。

All Traits

數值陣列

第一方和第三方特徵ID的陣列,包含訪客自上次產生資料摘要以來符合資格的先前實現特徵和新特徵。

Customer Data Feed 檔案結構

列出並定義CDF檔案的資料結構。 這包括資料序列、欄位分隔字元和分隔符號、資料檔案映射和範例檔案。

資料欄位標識符和序列

CDF 檔案不包含標示為的欄或欄位標題。相反,CDF檔案定義了具有非打印ASCII字元的欄位和陣列。 此外,CDF檔案還按特定順序列出每個欄位和陣列。 了解欄位識別碼和順序有助於正確剖析檔案。

CDF檔案元素 說明

欄位分隔符號和分隔字元

這些非列印字元定義CDF檔案的元素和結構:

  • Ctrl + a(ASCII 001 ^A)用非打印空間指示器分隔單個欄位中的資料。
  • Ctrl + b(ASCII 002 ^B)可分隔資料和陣列及請求參數。
  • Ctrl + c(ASCII 003 ^C)定義鍵值對。

欄位順序

重要:Audience Manager保留在未來版本中新增欄位至CDF檔案結尾的權利。 這表示檔案解析系統的技術設計不應假設固定列數(儘管它可能假設現有列的順序固定)。

CDF檔案中的資料會依下列順序顯示。

  1. 事件時間
  2. 裝置
  3. 容器 ID
  4. 已實現的特徵
  5. 已實現區段
  6. 要求參數
  7. Referer
  8. IP 位址
  9. Experience Cloud裝置ID(或MID)。 另請參閱 Cookie與Adobe Experience Platform Identity Service
  10. 所有區段
  11. 所有特徵

如需欄位說明,請參閱定義的客戶資料摘要內容

CDF 檔案圖

CDF 檔案資料會依下列順序顯示。

識別陣列

CDF檔案中的陣列以Ctrl + a欄位分隔符開頭和結尾。 這會使陣列中的第一個元素看起來像獨立資料欄位。 例如,實現的traits陣列以^A1234開頭。 陣列分隔字元和ID ^B5678遵循此項。 因此,您可能會想到已實現traits陣列中的第一個元素是ID 5678(因為它以^B開頭)。 但情況並非如此,因此您必須熟悉資料檔案的順序和結構。 即使實現的trait陣列中的第一個元素(或CDF檔案中的任何其他陣列)以^A開頭,檔案中的外觀或位置順序仍定義陣列的開頭。 而且,陣列中的第一個元素總是通過^A與前一個條目分離。

範例CDF檔案

範例CDF檔案看起來可能類似於以下內容。 我們已在此範例中插入分行,以協助其符合頁面大小。

Customer Data Feed 檔案命名慣例

以下各節列出並定義CDF檔案名中的元素。

CDF 檔案名:語法和範例

典型的CDF檔案名包含下列元素。 注意, 斜體​表示變數預留位置:

語法

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF-PARTNER-ID-AAM PROCESS-ID_0.gz

範例

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_000058_0.gz

在您的S3儲存貯體中,檔案會依合作夥伴ID(PID)、日和小時以升序排序。

CDF 定義的檔案名元素

下表列出並定義CDF檔案名中的元素。

檔案名元素 說明

s3://aam-cdf/

這是Amazon S3伺服器上CDF檔案的預設根儲存貯體。

your S3 bucket name

唯讀儲存CDF檔案的S3儲存貯體名稱。

day=yyyy-mm-dd

處理檔案的日期。

hour=hh

以24小時標籤法表示並以UTC時區設定的時間值。 另請參閱客戶資料摘要檔案名稱時間和檔案內容時間……

partner ID

您的合作夥伴ID。

AAM process ID_0

內部Audience Manager進程ID。

.gz

gzip檔案副檔名。 CDF檔案會壓縮。

Customer Data Feed 檔案處理通知

Audience Manager 將檔 .info 案寫入 S3 目錄,以告知您的( Customer Data File ) CDF準備好下載的時間。.info檔案還包含有關CDF檔案內容的JSON格式化元資料。 請參閱本節,了解此通知檔案使用的語法和欄位的相關資訊。

範例資訊檔案

每個.info檔案都包含FilesTotals區段。 Files區段包含一個陣列,內含每個每小時檔案的特定度量。 Totals區段包含特定日期內所有CDF檔案的匯總量度。 .info檔案的內容看起來可能類似於以下示例。

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

定義的資訊檔案欄位

下表列出並定義CDF .info檔案中的元素。

檔案對象

欄位 說明

Files

啟動包含CDF檔案相關元資料的陣列。

FileByteSize

檔案大小(以位元組為單位)。

FileChecksumMD5

Amazon S3 ETag。 連字型大小後面的數字會顯示在多部分上傳期間用於建立檔案的部件數量。 ETag與檔案的MD5校驗和不相同。

FileName

檔案名。 請參閱客戶資料摘要檔案命名慣例

FileSequenceNumber

每個檔案的索引號。

總計對象

欄位 說明

Totals

啟動包含所有CDF檔案匯總資料的對象。

Day

資料可用的日期。 使用yyyy-mm-dd格式。

Hour

資料可用的小時。 使用UTC時區中設定的24小時格式。

TotalByteSize

該日期所有CDF檔案的總大小(以位元組為單位)。

TotalNumberFiles

上傳至S3目錄的檔案總數。

Customer Data Feed 檔案名稱時間和檔案內容時間不同

您的CDF檔案包含檔案名和檔案內容中的時間戳。 這些時間戳記會為相同的CDF檔案記錄不同的事件進程。 同一檔案的名稱和內容中會出現不同時間戳記,這種情況並不罕見。 了解每個時間戳記有助於您避免處理此資料或嘗試依時間排序時的常見錯誤。

找到CDF檔案時間戳

CDF 檔案在2個不同位置記錄的時間不同。

了解時間戳記之間的差異

下表提供關於CDF檔案時間戳的其他詳細資訊,以及如何正確使用這些時間戳的資訊。

時間戳記位置 說明
檔案名稱 CDF檔案名稱中的時間戳記會標籤Audience Manager開始準備要傳送的檔案的時間。 此時間戳記設定在UTC時區中。 它使用hour=參數,以24小時表示法將時間格式化為2位數小時。 此時間可能與檔案內容中記錄的事件時間不同。 使用CDF檔案時,有時您會發現您的S3貯體在特定小時內為空。 空貯體表示可能表示下列其中一項:
  • 那個鐘頭沒有資料。
  • 我們的伺服器負載很重,無法處理特定小時的檔案。 當伺服器追上時,會將原本應在先前時間貯體中的檔案放入具有稍後時間值的貯體中。 例如,當應位於17小時儲存貯體的檔案出現在18小時儲存貯體中時(檔案名稱中為hour=18),您就會看到這個訊息。 在這種情況下,伺服器可能在17小時內開始處理您的檔案,但在該時間間隔內無法完成。 相反地,檔案會推送至下一個每小時時段。

重要:請勿使用檔案名稱時間戳記依時間分組事件。如果需要按時間分組,請在檔案內容中使用EventTime時間戳記。
檔案內容 CDF檔案內容中的時間戳記會標籤Data Collection Servers開始處理檔案的時間。 此時間戳記設定在UTC時區中。 它使用EventTime欄位,時間格式為​yyyy-mm-dd hh:mm:ss。 此時間接近頁面上事件的實際時間,但可能與檔案名稱中的小時指標不同。
提示:與檔案 hour= 名稱中的時間戳記不同,您可以 EventTime 使用依時間分組資料。

本頁內容