編輯記錄處理組態檔

編輯資料集描述檔之Log Processing.cfg檔案的步驟。

  1. 在資料集設定檔中工作時,開啟Profile Manager並按一下​Dataset​以顯示其內容。

    有關開啟和使用Profile Manager的資訊,請參閱​Data Workbench使用手冊

    注意

    Dataset目錄中可能存在「日誌處理」子目錄。 此子目錄包含已為一個或多個繼承配置檔案建立的Log Processing Dataset Include檔案。 請參閱資料集包含檔案

  2. 按一下右鍵Log Processing.cfg旁邊的複選標籤,然後按一下​Make Local。 此檔案的複選標籤會出現在User列中。

  3. 按一下右鍵新建的複選標籤,然後按一下​Open > in Workstation。 出現Log Processing.cfg窗口。

    您也可以從Transformation Dependency Map開啟Log Processing.cfg檔案。 有關轉換相關性映射的資訊,請參見資料集配置工具

  4. 使用下表作為指南編輯配置檔案中的參數。

    在資料工作台視窗中編輯Log Processing.cfg檔案時,您可使用快速鍵來編輯基本功能,包括剪下(Ctrl+x)、複製(Ctrl+c)、貼上(Ctrl+v)、復原(Ctrl+z)、重做(Ctrl+Shift+z)、選取區段(按一下+拖曳),然後選取所有(Ctrl+a)。 您也可以使用捷徑,將一個設定檔案(.cfg)的文字複製並貼到另一個設定檔。

    注意

    繼承的配置檔案的Log Processing Dataset Include檔案包含下表中所述參數的子集以及一些其他參數。 請參閱資料集包含檔案

    參數 說明
    記錄來源 資料來源。 請參閱記錄來源
    結束時間

    選填。篩選資料以包含時間戳記最多但不包含此時間的記錄項目。 Adobe建議目前使用下列其中一種格式:

    • 2013年1月1日美國東部夏令時間
    • 2013年1月1日HH:MM:SS GMT

    例如,指定「2013年7月29日美國東部夏令時間00:00:00」作為「結束時間」時,會包含截至2013年7月28日(美國東部夏令時間下午11:59:59)的資料。 請參閱資料篩選

    您必須指定時區。 如果未指定,時區不預設為GMT。 有關資料工作台伺服器支援的時區縮寫的清單,請參閱時區代碼

    注意: 感測器、日誌檔案和XML源的「使用開始/結束時間」參數與此參數相關。 請參閱 Log Sources 中討論這些來源類型的章節。

    欄位 選填。Adobe建議在一個或多個日誌處理資料集包含檔案中定義欄位。 請參閱記錄處理資料集包含檔案
    組最大密鑰位元組數

    伺服器可針對單一追蹤ID處理的事件資料量上限。 從資料集建構程式中篩選超過此限制的資料。 當鍵拆分處於活動狀態時,此值必須設定為2e6,當鍵拆分不活動時,此值必須設定為1e6。 請參閱鍵拆分

    注意: 不要在未諮詢Adobe的情況下更改此值。

    雜湊閾值

    選填。用於隨機行子採樣的採樣因子。 若設為數字n,則每n個追蹤ID中只有一個會進入資料集,將資料集中的列總數減少n倍。

    若要建立需要100%正確率的資料集(亦即包含所有列),您可將雜湊臨界值設為1。

    值:

    雜湊臨界值= 1 (包含所有列的100%資料)。

    雜湊臨界值= 2 (1/2的資料並包含一半的列)。

    雜湊臨界值= 3 (資料的1/3,並包含三列其中一列,但在「查詢完成」中四捨五入至34%)

    雜湊臨界值= 4 (每4個資料中有1/4,並包含每4列1行。)

    注意: 使用雜湊閾值= 8 可提供1/8的資料,即12.5%。 不過,此值的查詢完成值會四捨五入為13%。 其他範例包括雜湊臨界值= 6 ,可產生17%的查詢解析度。 雜湊臨界值= 13 會產生8%的查詢解析度。

    如果雜湊閾值日誌處理 Transformation.cfg 檔案中都指定了 ,則不按順序應用它;任一配置檔案中設定的最大值都適用。 請參閱資料篩選

    記錄項目條件 選填。定義將日誌條目納入資料集的規則。 請參閱日誌條目條件
    重新處理

    選填。您可在此處輸入任何字元或字元組合。 更改此參數並將檔案保存到資料工作台伺服器電腦會啟動資料重新處理。

    請參閱重新處理和重新轉換

    分割關鍵時段空間

    關鍵拆分涉及的參數。 當密鑰拆分處於活動狀態時,其值應為6e6。 請參閱鍵拆分

    注意: 不要在未諮詢Adobe的情況下更改此值。

    拆分鍵位元組

    關鍵拆分涉及的參數。 當鍵拆分處於活動狀態時,其值應為1e6;當鍵拆分不活動時,其值應為0。 請參閱鍵拆分

    注意: 不要在未諮詢Adobe的情況下更改此值。

    拆分鍵空間比

    關鍵拆分涉及的參數。 當鍵拆分處於活動狀態時,其值應為10。 請參閱鍵拆分

    注意: 不要在未諮詢Adobe的情況下更改此值。

    階段

    選填。可用於日誌處理資料集的處理階段名稱包括檔案。 處理階段提供了對日誌處理資料集包含檔案中定義的轉換排序的方法。 如果您已在多個日誌處理資料集包含檔案中定義了一個或多個轉換,並且您希望在日誌處理過程中在特定點執行特定轉換,則此參數非常有用。

    此處列出階段的順序決定了在日誌處理期間執行日誌處理資料集包含檔案中轉換的順序。 預處理和後處理是內建階段。 預處理始終是第一階段,後處理則是最後階段。 依預設,有一個名為「預設」的命名階段。

    若要新增處理階段

    • Log Processing.cfg 窗口中,按一下右鍵 Stages ,然後按一下 Add New > Stage
    • 輸入新階段的名稱。

    刪除現有處理階段

    • 按一下右鍵要刪除的階段所對應的編號,然後按一下刪除< #stage_number >

    注意: 當您在記錄處理資料集包含檔案中指定階段時,階段名稱必須完全符合您在此處輸入的名稱。 請參閱資料集包含檔案

    開始時間

    選填。篩選資料,以包含目前或之後具有時間戳記的記錄項目。 Adobe建議目前使用下列其中一種格式:

    • 2013年1月1日美國東部夏令時間
    • 2013年1月1日HH:MM:SS GMT

    例如,指定「2013年7月29日美國東部夏令時間00:00:00」作為「開始時間」時,會包含從2013年7月29日美國東部夏令時間12:00:00開始的資料。 請參閱資料篩選

    您必須指定時區。 如果未指定,時區不預設為GMT。 有關資料工作台伺服器支援的時區縮寫的清單,請參閱時區代碼

    注意: 感測器、日誌檔案和XML源的「使用開始/結束時間」參數與此參數相關。 請參閱 Log Sources 中討論這些來源類型的章節。

    時區

    選填。記錄處理期間用於時間轉換的資料工作台伺服器的時區(例如由x-local-timestring欄位表示的轉換)。

    注意: 如果要在資料集構建的日誌處理階段訪問轉換的時間欄位,則必須指定時區。 否則,資料工作台伺服器會在事件記錄檔中記錄錯誤。

    請參閱時區

    轉換 選填。Adobe建議在一個或多個日誌處理資料集包含檔案中定義日誌處理的轉換。 請參閱記錄處理資料集包含檔案
  5. 按一下右鍵窗口頂部的​(modified) ,然後按一下​Save

  6. 在Profile Manager中,按一下右鍵User列中Log Processing.cfg的複選標籤,然後按一下​Save to > dataset profile name> ,使本地更改生效。 重新處理資料是在同步資料集描述檔後開始。

    注意

    請勿將修改過的配置檔案保存到Adobe提供的任何內部配置檔案中,因為安裝這些配置檔案的更新時將覆蓋您所做的更改。

    如需重新處理資料的詳細資訊,請參閱重新處理和重新轉換

本頁內容

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now