Customer Data Feeds customer-data-feeds

有關以下專案的基本資訊: Customer Data Feed (CDF)檔案和如何開始使用的說明。 如果您有興趣接收,請從這裡開始 CDF 檔案或只是想要更多資訊。

文件内容和目的 file-contents-purpose

CDF 文件包含的数据与 Audience Manager 事件调用 (/event) 发送到我们服务器的数据相同。这包括点赞用户 Id、 trait IDs 、 segment IDs 以及由事件调用捕获的所有其他参数的数据。 内部 Audience Manager 系统会将事件数据处理到一个 CDF 文件中,内容组织到按设置的顺序显示的字段中。 Audience Manager 嘗試產生 CDF 每小時都會建立檔案,並儲存在上安全、客戶特定的貯體中 Amazon S3 伺服器。 我們提供這些檔案,讓您可以 Audience Manager 資料超出使用者介面所設限制。

IMPORTANT
使用CDF檔案時,請注意下列限制:
  • 設定CDF檔案傳送之前,請確定您擁有來自第三方資料提供者的適當許可權,可匯出第三方特徵。 Audience Manager目前不支援使用者介面中的功能,無法向協力廠商資料提供者要求CDF檔案傳遞匯出許可權,因此請單獨與他們聯絡。
  • 您不應使用 CDF 檔案作為Proxy來監控頁面流量、協調報表差異或計費等。

入门指南 getting-started

沒有要啟動的自助服務程式 CDF 檔案傳送。 聯絡您的 Audience Manager 顧問或客戶服務人員開始使用。 實施期間,您的 Audience Manager 代表將:

  • 設定您的 Amazon S3 儲存貯體。
  • 提供唯讀 S3 檔案儲存貯體的驗證認證。 您將無法檢視或存取其他客戶的目錄和檔案。

檔案通知和 CDF 檔案將顯示在您的 S3 儲存貯體。 您負責監視和下載指派給您的檔案 S3 目錄。 请参阅客户数据信息源文件处理通知

后续步骤 next-steps

以下各節及 客戶資料摘要常見問題集 可協助您進一步熟悉此服務。

Customer Data Feed 已定義內容 cdf-defined

列出並定義中的資料元素和陣列 CDF 檔案,依外觀順序。 定義包含資料型別,但此資訊不是的一部分 CDF 檔案。

IMPORTANT
CDF設定預設會排除事件畫素。 如果您希望將事件畫素包含在CDF檔案中,請務必在傳送給客戶服務的請求中指定。 每個事件畫素都會填入CDF檔案中的唯一列。

定义 definitions

A CDF 檔案包含下面定義的部分或全部欄位。 如需內部檔案組織的相關資訊,請參閱 客戶資料摘要檔案結構.

字段
数据类型
描述
Event Time
時間戳記

處理CDF檔案的時間 資料收集伺服器 (DCS)。 時間戳記會使用 yyyy-mm-dd hhss 格式並設定為UTC時區。

注意:事件时间 是:

Device
字符串
這是 不重複使用者ID (UUID),網站訪客的38位數裝置ID。 另请参阅 Audience Manager 中的 ID 索引
Container ID
数值
觸發ID同步的容器的ID。 只有當您在中設定容器ID時,此欄位才會填入 d_nsid 欄位。 否則,預設值0將不會包含在CDF檔案中。
Realized Traits
數值陣列

一個特徵ID陣列,包含訪客在事件呼叫中實現(符合資格)的所有特徵。

請注意,陣列可包含訪客之前已符合資格的特徵,以及訪客透過此事件呼叫重新符合資格的特徵。

Realized Segments
數值陣列
區段ID陣列,包含訪客在事件呼叫中實現(符合)的所有區段。
Request Parameters
字符串

擷取所有引數(變數、ID、機碼值組、裝置廣告ID等)的字串。 已在事件呼叫中傳入。

簡短範例:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type
字符串
反向链接页面的未编码 URL (如果有)。
IP Data Type
字符串
訪客在事件呼叫中擷取的IP位址。
MCDevice
字符串
此 Experience Cloud 指派給網站訪客的ID (MID)。 另請參閱 Cookie與AdobeExperience Platform識別服務.
All Segments
數值陣列
區段ID陣列,包含訪客符合資格的先前實現區段和新區段。
All Traits
數值陣列
第一方和第三方特徵ID陣列,包含訪客自上次產生資料摘要以來符合資格的先前實現的特徵和新特徵。

Customer Data Feed 檔案結構 cdf-file-structure

列出並定義 CDF 檔案。 这包括数据序列、字段分隔符和分隔符、数据文件映射和示例文件。

数据字段标识符和序列 identifiers-and-sequence

CDF 文件不包含已标记的列或字段标题。 相反, CDF 文件会定义包含非打印 ASCII 字符的字段和数组。 此外, CDF 檔案會以特定順序列出每個欄位和陣列。 瞭解欄位識別碼和順序將有助於您正確剖析檔案。

CDF檔案元素
描述
欄位分隔符號和分隔符號

這些非列印字元定義CDF檔案的元素和結構:

  • Ctrl + a (ASCII) 001^A)會以非列印用的空格指示器分隔個別欄位中的資料。
  • Ctrl + b (ASCII) 002^B)將資料分隔為陣列和要求引數。
  • Ctrl + c (ASCII) 003^C)會定義機碼值組。
欄位順序

重要: Audience Manager 保留在未來版本中在CDF檔案結尾新增新欄位的權利。 這表示檔案剖析系統的技術設計不應假設欄數固定(雖然它可能假設現有欄的順序固定)。

CDF檔案中的資料會以下列順序顯示。/N可以取代這些欄位中的任何一個,表示null值。

  1. 事件時間
  2. 设备
  3. 容器 ID
  4. 已實現的特徵
  5. 已實現的區段
  6. 请求参数
  7. Referer
  8. IP 地址
  9. Experience Cloud裝置ID (或MID)。 另請參閱 Cookie與Adobe Experience Platform Identity服務
  10. 所有區段
  11. 所有特徵

如需欄位說明,請參閱 已定義客戶資料摘要內容.

CDF 檔案地圖 cdf-file-map

CDF 文件数据按下面显示的顺序显示。

识别数组

文件中 CDF 的数组开始并以 Ctrl + a 字段分隔符结尾。 这会使数组中的第一个元素显示点赞独立的数据字段。 例如,已实现 traits 的数组以开头 ^A1234 。 陣列分隔符號和ID ^B5678 會依循此專案。 因此,您可能會覺得已實現中的第一個元素 traits 陣列識別碼為5678 (因為它開頭為 ^B)。 但事實並非如此,因此您需要熟悉資料檔案的順序和結構。 即使已實現中的第一個元素 trait 陣列(或中任何其他陣列) CDF file)開頭為 ^A中,檔案中的外觀或位置順序會定義陣列的開頭。 而且,陣列中的第一個元素一律會與前一個專案分開,分隔方式如下 ^A.

範例 CDF 檔案 sample-file

範例 CDF 檔案可能類似於以下內容。 我們在此範例中插入了分行符號,以協助它符合頁面。

Customer Data Feed 檔案命名慣例 cdf-naming-conventions

以下各節列出並定義中的元素 CDF 檔案名稱。

CDF 檔案名稱:語法和範例 cdf-file-name

典型 CDF 檔案名稱包含下列元素。 注意, 斜體 表示變數預留位置:

语法

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

示例

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

在您的 S3 儲存貯體,檔案會依合作夥伴ID (PID)、日和小時。

CDF 已定義的檔案名稱元素 cdf-file-name-elements

下表列出并定义了文件名中 CDF 的元素。

文件名称元素
描述
s3://aam-cdf/
這是Amazon S3伺服器上CDF檔案的預設根儲存貯體。
your S3 bucket name
儲存CDF檔案的唯讀S3儲存貯體名稱。
day=yyyy-mm-dd
處理您的檔案的日期。
hour=hh
以24小時標籤法表示並以UTC時區設定的時間值。 另請參閱 客戶資料摘要檔案名稱時間與檔案內容時間…….
partner ID
您的合作夥伴ID。
File Sequence_0
識別檔案序列的值。 序列增量如下: 0_0_0 、 0_1_0 、 0_2_0....1_0_0
.gz
gzip副檔名。 CDF檔案會以gzip壓縮。

Customer Data Feed 檔案處理通知 cdf-file-processing-notifications

Audience Manager 寫入 .info 檔案至您的 S3 目錄,通知您何時使用 Customer Data File (CDF)已可供下載。 此 .info 檔案也包含 JSON 有關您檔案內容的格式化中繼資料 CDF 檔案。 有关此通知文件使用的语法和字段的信息,请查看此部分。

示例信息文件 sample-info-file

每个文件都 .info 包含一个 FilesTotals 部分。 该 Files 区域包含一个数组,用于保存每小时文件的特定量度。 此 Totals 區段包含所有量度彙總 CDF 特定日期的檔案。 您的網站內容 .info 檔案看起來可能類似於以下範例。

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

已定義的資訊檔案欄位 info-file-fields-defined

下表列出並定義 CDF .info 檔案。

檔案物件

字段
描述
Files
啟動包含CDF檔案中繼資料的陣列。
FileByteSize
檔案大小(位元組)。
FileChecksumMD5
Amazon S3 ETag。 連字型大小後面的數字顯示了在多部分上傳期間用來建置檔案的部分的數量。 此 ETag 與檔案的MD5總和檢查碼不相同。
FileName
檔案名稱。 另請參閱 客戶資料摘要檔案命名慣例.
FileSequenceNumber
每個檔案的索引編號。

總計物件

字段
描述
Totals
啟動包含所有CDF檔案之彙總資料的物件。
Day
資料可用的日期。 使用 yyyy-mm-dd 格式。
Hour
有資料可用的小時。 使用UTC時區設定的24小時格式。
TotalByteSize
該日期所有CDF檔案的總大小(以位元組為單位)。
TotalNumberFiles
上傳至S3目錄的檔案總數。

Customer Data Feed 檔案名稱時間與檔案內容時間不同 different-processing-times

您的 CDF 檔案包含檔案名稱和檔案內容的時間戳記。 這些時間戳記會針對相同專案記錄不同的事件程式 CDF 檔案。 在同一個檔案的名稱和內容中看到不同的時間戳記是很常見的現象。 瞭解每個時間戳記可協助您在使用此資料或嘗試依時間排序資料時避免常見錯誤。

定位 CDF 檔案時間戳記 locating-timestamps

CDF 檔案在2個不同的位置記錄時間的方式不同。

瞭解時間戳記之間的差異 understanding-timestamps

下表提供您專屬的 CDF 檔案時間戳記以及如何正確使用的相關資訊。

時間戳記位置
描述
文件名

中的時間戳記 CDF 檔案名稱會標籤時間: Audience Manager 已開始準備檔案以進行傳送。 此時間戳記設定於 UTC 時區。 它會使用 hour= 引數,時間格式為24小時標籤法的2位數小時。 此時間可能與檔案內容中記錄的事件時間不同。 使用時 CDF 檔案,有時您會注意到 S3 值區在特定小時內為空白。 空白貯體表示可能有下列其中一種情況:

  • 沒有該特定小時的資料。
  • 我們的伺服器負載過重,無法在特定小時內處理檔案。 當伺服器趕上進度時,會將原本應該放在較早時段檔案中的檔案放入具有較晚時間值的貯體中。 例如,當應在17小時貯體中的檔案出現在18小時貯體時(具有 hour=18 (在檔案名稱中)。 在這種情況下,伺服器可能在17小時內開始處理您的檔案,但無法在該時間間隔內完成它。 相反地,檔案會推送至下一個每小時時段。

重要:請勿使用檔案名稱時間戳記,依時間將事件分組。 如果您需要依時間分組,請使用 EventTime 檔案內容中的時間戳記。

檔案內容
中的時間戳記 CDF 檔案內容會標籤時間 Data Collection Servers 已開始處理檔案。 此時間戳記設定於 UTC 時區。 它會使用 EventTime 欄位,時間格式為 yyyy-mm-dd hh:mm:ss. 此时间与页面中事件的实际时间接近,但它可以不同于文件名中的小时指示器。
提示 :与文件名中的 hour= 时间戳不同,您可以 EventTime 按时间群组数据。
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695