瞭解資料集建構

Adobe資料集包含Data Workbench伺服器已載入及處理的資料。

由Data Workbench伺服器(InsightServer64.exe)載入及處理資料的步驟構成資料集建構程式。

注意

處理及提供來自Adobe資料集資料的資料的Data Workbench伺服器稱為資料處理單元或DPU。 它有時稱為處理伺服器或查詢伺服器。 Data Workbench和Report用戶端會直接與DPU互動。

在資料集建構期間,Data Workbench伺服器會從記錄來源讀取來源資料、將轉換套用至特定資料欄位,以及定義要從轉換後欄位建立的延伸維度。 施工過程分為兩個階段:日誌處理​和​轉換。 建立資料集後,您就可以使用資料集的延伸維度,針對特定分析目的建立衍生量度和維度。

資料集建構就像一個製造過程。 您可以選取要用來建立資料集的資料(原材料),然後定義資料轉換(處理步驟),以處理資料中可用的資訊來建立擴展尺寸(製造產品)。

會篩選記錄,並識別要傳遞至轉換階段的資料欄位。 在記錄處理階段結束時,資料會依追蹤ID分組(即,具有相同追蹤ID的所有記錄項目會分組在一起),並依時間排序。 在記錄處理階段期間,您無法存取要用於分析的已處理資料。

指定日誌源

記錄來源是包含要用來建立資料集之資料的檔案。 記錄來源中可用的資料稱為事件資料,因為每個資料記錄代表交易記錄或事件的單一例項。 此外,每個記錄或記錄項目都包含稱為追蹤ID的值。

注意

選取記錄來源時,請確定每個記錄項目都包含實體的追蹤ID,該ID代表要將資料分組的最高層級。 例如,如果您使用從網站流量收集的資料,您可能會選擇訪客為此實體。 每個訪客都有一個唯一的追蹤ID,而關於特定網站訪客的所有資料都可分組在一起。 如需協助,請聯絡Adobe。

記錄來源事件資料由Sensors即時收集,或由Insight Server從封存的資料來源擷取。 感測器從HTTP和應用程式伺服器收集的事件資料會傳送至Insight Server,由Insight Server將資料轉換為高度壓縮的記錄檔(.vsl)檔案。 一般檔案、XML檔案或ODBC資料源中的事件資料由Insight Server讀取,Insight Server提供您定義的解碼器,以便從這些不同格式中擷取一般記錄欄位集。

定義轉換

轉換是一組指令,您可以定義這些指令來擷取或操控事件資料中的資訊。 您定義的每個轉換都會套用至每個事件資料記錄(記錄項目),以更新現有記錄欄位或產生新欄位。 轉換結果與日誌條目條件一起使用,以評估在日誌處理期間從資料集中過濾出哪些日誌條目。

並非所有類型的轉換都可在資料集建構程式的記錄處理階段期間使用。

篩選日誌

資料集包含數個參數,可用來篩選轉換中傳出的資料。 篩選用來指定後續處理步驟中使用的記錄項目。 例如,篩選器可由、時間範圍、伺服器回應的狀態,或IP位址和使用者代理資訊來定義。 Log Entry Condition是可自訂的篩選測試。 測試會在每個記錄項目的欄位中尋找特定條件,以判斷該項目是否應在資料集建構程式中進一步處理。 如果日誌條目不符合條件,則該條目將從構建過程中刪除。

標識轉換的欄位

如果要將資料欄位從日誌處理階段傳遞至轉換階段,以供進一步處理,您必須在日誌處理期間識別該欄位。 無論欄位是否可從日誌源中使用,還是從日誌處理期間應用於資料的資料轉換中建立,都適用此要求。

在資料集建構的轉換階段,會對從記錄處理輸出的分組和有序資料進行處理。 會執行其他資料轉換,並建立擴展資料維度以用於分析。 在轉換階段期間,您可以存取隨著轉換階段接近完成而變大的資料統計範例。

定義轉換

您可以定義要在資料集建構程式的轉換階段期間使用的轉換,以便建立延伸維度。 每個轉換都會套用至從記錄處理傳遞的每個事件資料記錄(記錄項目)。

篩選日誌

在轉換期間可套用Log Entry Condition,以在來自記錄處理的每個記錄項目欄位中尋找特定條件。 如果日誌條目不符合條件,則該條目將從構建過程中刪除。

定義延伸維度

延伸維度是資料集建置程式的最終產品。 它們代表資料中記錄欄位之間的關係。 您可以透過這些維度來建立視覺效果、建立延伸量度或執行分析,以了解業務的特定操作和問題。

本頁內容