Customer Data Feeds customer-data-feeds

有關Customer Data Feed (CDF)檔案的基本資訊,以及如何開始使用的說明。 如果您有興趣接收CDF個檔案或只是想要更多資訊,請從這裡開始。

檔案內容和用途 file-contents-purpose

CDF檔案包含的資料與Audience Manager事件呼叫(/event)傳送至我們伺服器的資料相同。 這包括使用者ID、trait IDs、segment IDs等資料,以及事件呼叫所擷取的所有其他引數。 內部Audience Manager系統將事件資料處理為CDF檔案,其內容已整理到以設定順序出現的欄位中。 Audience Manager嘗試每小時產生CDF個檔案,並將它們儲存在Amazon S3伺服器上安全、特定於客戶的貯體中。 我們會提供這些檔案,讓您能夠不受使用者介面的限制使用Audience Manager資料。

IMPORTANT
使用CDF檔案時,請注意下列限制:
  • 設定CDF檔案傳送之前,請確定您擁有來自協力廠商資料提供者的適當許可權,可匯出協力廠商特徵。 Audience Manager目前不支援使用者介面中的功能,無法向協力廠商資料提供者要求CDF檔案傳遞匯出許可權,因此請單獨聯絡他們。
  • 您不應該使用CDF檔案當做Proxy來監視頁面流量、調解報告差異或計費等。

快速入門 getting-started

沒有自助式處理程式可啟動CDF檔案傳遞。 請連絡您的Audience Manager顧問或客戶服務以開始使用。 實施期間,您的Audience Manager代表將:

  • 設定您的Amazon S3儲存貯體。
  • 提供唯讀的S3驗證認證給您的檔案儲存貯體。 您將無法檢視或存取其他客戶的目錄和檔案。

當檔案通知和CDF檔案準備下載時,它們將會顯示在您的S3儲存貯體中。 您負責監視及下載您指派的S3目錄中的檔案。 請參閱客戶資料摘要檔案處理通知

後續步驟 next-steps

以下章節及客戶資料摘要常見問題集可協助您更熟悉此服務。

已定義Customer Data Feed內容 cdf-defined

依照外觀順序,列出並定義CDF檔案中的資料元素和陣列。 定義包含資料型別,但此資訊不是CDF檔案的一部分。

IMPORTANT
CDF設定中預設會排除事件畫素。 如果您想要在CDF檔案中包含事件畫素,請務必在傳送給客戶服務的請求中指定。 在CDF檔案中,每個事件畫素都會填入為唯一的列。

定義 definitions

CDF檔案包含下面定義的部分或全部欄位。 如需內部檔案組織的相關資訊,請參閱客戶資料摘要檔案結構

欄位
資料類型
說明
Event Time
時間戳記

資料收集伺服器 (DCS)處理CDF檔案的時間。 時間戳記使用 yyyy-mm-dd hhss 格式,且設定為UTC時區。

注意:事件時間 不是

Device
字串

這是不重複使用者ID (UUID),這是您網站訪客的38位數裝置識別碼。 另請參閱Audience Manager中的識別碼索引。

Container ID
數值
引發ID同步的容器的ID。 只有在您於網站實作的 d_nsid 欄位中設定容器ID時,才會填入此欄位。 否則,預設值0將不會包含在CDF檔案中。
Realized Traits
數值陣列

一個特徵ID陣列,包含訪客在事件呼叫中變現(符合資格)的所有特徵。

請注意,陣列可包含訪客之前已符合資格的特徵,以及訪客透過此事件呼叫重新符合資格的特徵。

Realized Segments
數值陣列
區段ID陣列,包含訪客在事件呼叫中實現(符合)的所有區段。
Request Parameters
字串

擷取所有引數(變數、ID、機碼值組、裝置廣告ID等)的字串。 已傳入事件呼叫。

簡短範例:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type
字串
反向連結頁面的未編碼URL (如果有的話)。
IP Data Type
字串
訪客在事件呼叫中擷取的IP位址。
MCDevice
字串
指派給網站訪客的Experience Cloud ID (MID)。 另請參閱 Cookie與AdobeExperience Platform識別服務
All Segments
數值陣列
一個區段ID陣列,包含訪客符合資格的先前實現區段和新區段。
All Traits
數值陣列
第一方和第三方特徵ID陣列,包含訪客自上次產生資料摘要以來符合資格之先前實現的特徵和新特徵。

Customer Data Feed檔案結構 cdf-file-structure

列出並定義CDF檔案的資料結構。 這包括資料順序、欄位分隔符號和分隔符號、資料檔案對映和範例檔案。

資料欄位識別碼和順序 identifiers-and-sequence

CDF個檔案未包含標示的欄或欄位標題。 相反,CDF檔案會定義具有非列印ASCII字元的欄位和陣列。 此外,CDF檔案會以特定順序列出每個欄位和陣列。 瞭解欄位識別碼和順序將有助於您正確剖析檔案。

CDF檔案元素
說明
欄位分隔符號和分隔符號

這些非列印字元定義CDF檔案的元素和結構:

  • Ctrl + a (ASCII 001 ^A)以非列印空間指示器分隔個別欄位中的資料。
  • Ctrl + b (ASCII 002 ^B)將資料與陣列及要求引數分開。
  • Ctrl + c (ASCII 003 ^C)定義機碼值組。
欄位順序

重要: Audience Manager保留在未來發行版本中新增欄位至CDF檔案結尾的權利。 這表示檔案剖析系統的技術設計不應假設欄數固定(但現有欄可能會假設順序固定)。

CDF檔案中的資料會以下列順序顯示。/N可以出現在這些欄位中,代表空值。

  1. 事件時間
  2. 裝置
  3. 容器 ID
  4. 已實現的特徵
  5. 已實現的區段
  6. 要求參數
  7. Referer
  8. IP 位址
  9. Experience Cloud裝置ID (或MID)。 另請參閱 Cookie與Adobe Experience Platform Identity服務
  10. 所有區段
  11. 所有特徵

如需欄位說明,請參閱已定義的客戶資料摘要內容

CDF檔案地圖 cdf-file-map

CDF檔案資料會以下列順序顯示。

識別陣列

CDF檔案中的陣列以Ctrl + a欄位分隔符號開始和結束。 這會使陣列中的第一個元素看起來像獨立資料欄位。 例如,已實現的traits陣列以^A1234開頭。 陣列分隔符號和識別碼^B5678會依循此專案。 因此,您可能會認為已實現的traits陣列中的第一個元素識別碼5678 (因為它以^B開頭)。 但事實並非如此,因此您需要熟悉資料檔案的順序和結構。 即使已實現的trait陣列中的第一個元素(或CDF檔案中的任何其他陣列)以^A開頭,檔案中的外觀順序或位置定義陣列的開頭。 而且,陣列中的第一個元素一律會以^A與前一個專案分開。

範例CDF檔案 sample-file

範例CDF檔案可能類似於以下內容。 我們在此範例中插入分行符號,以協助它符合頁面。

Customer Data Feed檔案命名慣例 cdf-naming-conventions

以下區段列出並定義您CDF檔案名稱中的元素。

CDF檔案名稱:語法和範例 cdf-file-name

一般CDF檔案名稱包含下列專案。 注意,斜體 ​表示變數預留位置:

語法

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

範例

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

在您的S3儲存貯體中,檔案會依合作夥伴ID (PID)、日和小時以遞增順序排序。

已定義CDF個檔案名稱元素 cdf-file-name-elements

下表列出並定義CDF檔案名稱中的專案。

檔案名稱元素
說明
s3://aam-cdf/
這是Amazon S3伺服器上CDF檔案的預設根儲存貯體。
your S3 bucket name
儲存CDF檔案的唯讀S3儲存貯體名稱。
day=yyyy-mm-dd
處理檔案的日期。
hour=hh
以24小時標籤法表示並以UTC時區設定的時間值。 另請參閱客戶資料摘要檔案名稱時間和檔案內容時間……
partner ID
您的合作夥伴ID。
File Sequence_0
識別檔案序列的值。 序列增量如下: 0_0_0 、 0_1_0 、 0_2_0....1_0_0
.gz
gzip副檔名。 CDF檔案會進行gzip壓縮。

Customer Data Feed個檔案處理通知 cdf-file-processing-notifications

Audience Manager會將.info檔案寫入您的S3目錄,以便在您的Customer Data File (CDF)準備下載時通知您。 .info檔案也包含有關CDF檔案內容的JSON格式化中繼資料。 請參閱本節,瞭解此通知檔案使用的語法和欄位。

範例資訊檔案 sample-info-file

每個.info檔案都包含FilesTotals區段。 Files區段包含一個陣列,內含每個每小時檔案的特定量度。 Totals區段包含特定日期所有CDF檔案的彙總量度。 .info檔案的內容可能類似於以下範例。

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

已定義的資訊檔案欄位 info-file-fields-defined

下清單格列出並定義CDF .info檔案中的專案。

檔案物件

欄位
說明
Files
啟動包含CDF檔案中繼資料的陣列。
FileByteSize
檔案大小(位元組)。
FileChecksumMD5
Amazon S3 ETag。 連字型大小後面的數字顯示了在多部分上傳期間用來建置檔案的部分的數量。 ETag與檔案的MD5總和檢查碼不相同。
FileName
檔案名稱。 請參閱客戶資料摘要檔案命名慣例
FileSequenceNumber
每個檔案的索引編號。

總計物件

欄位
說明
Totals
啟動包含所有CDF檔案之彙總資料的物件。
Day
資料可用的日期。 使用 yyyy-mm-dd 格式。
Hour
資料可用的小時。 使用UTC時區設定的24小時格式。
TotalByteSize
該日期所有CDF檔案的總大小,以位元組為單位。
TotalNumberFiles
上傳至S3目錄的檔案總數。

Customer Data Feed檔案名稱時間和檔案內容時間不同 different-processing-times

您的CDF檔案在檔案名稱和檔案內容中包含時間戳記。 這些時間戳記會針對相同的CDF檔案記錄不同的事件程式。 在同一個檔案的名稱和內容中看到不同的時間戳記是很常見的現象。 瞭解每個時間戳記可協助您在處理此資料或嘗試依時間排序資料時,避免常見錯誤。

找到CDF個檔案時間戳記 locating-timestamps

CDF個檔案記錄時間在2個不同位置不同。

瞭解時間戳記之間的差異 understanding-timestamps

下表提供有關您的CDF檔案時間戳記的更多詳細資料,以及如何正確使用這些時間戳記的資訊。

時間戳記位置
說明
檔案名稱

CDF檔案名稱中的時間戳記會標示Audience Manager開始準備傳送檔案的時間。 此時間戳記設定在UTC時區。 它使用hour=引數,時間格式為24小時表示法的2位數小時。 這個時間可能與檔案內容中記錄的事件時間不同。 處理CDF檔案時,有時您會注意到您的S3貯體在某一小時是空的。 空白貯體表示可能有下列其中一種情況:

  • 沒有該特定小時的資料。
  • 我們的伺服器負載過重,在特定小時內無法處理檔案。 當伺服器趕上進度時,會將原本應該放在較早時段檔案中的檔案放入具有較晚時間值的貯體中。 例如,當應在17小時貯體中的檔案出現在18小時貯體中(檔案名稱中包含hour=18)時,您會看到此訊息。 在此情況下,伺服器可能會在17小時內開始處理您的檔案,但無法在該時間間隔內完成它。 相反地,檔案會推送至下一個每小時時段。

重要:請勿使用檔案名稱時間戳記,依時間將事件分組。 如果您需要依時間分組,請在檔案內容中使用EventTime時間戳記。

檔案內容
CDF檔案內容中的時間戳記會標籤Data Collection Servers開始處理檔案的時間。 此時間戳記設定在UTC時區。 它使用EventTime欄位,時間格式為​ yyyy-mm-dd hh:mm:ss。 這個時間接近頁面上事件的實際時間,但可能不同於檔案名稱中的小時指標。
提示:與檔案名稱中的hour=時間戳記不同,您可以使用EventTime依時間將資料分組。
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695