編輯日誌處理配置檔案

編輯資料集描述檔之Log Processing.cfg檔案的步驟。

  1. 在資料集設定檔中工作時,請開啟並 Profile Manager 按一下以 Dataset 顯示其內容。

    如需開啟和使用的詳細資訊 Profile Manager,請參閱資 料工作台使用指南

    注意

    Dataset目錄中可能存在「日誌處理」子目錄。 此子目錄包含 Log Processing Dataset Include 已為一個或多個繼承的配置檔案建立的檔案。 請參閱 資料集包含檔案

  2. 按一下右鍵旁邊的複選標 Log Processing.cfg 記並按一下 Make Local。 此檔案的複選標籤將出現在列 User 中。

  3. 以滑鼠右鍵按一下新建立的核取標籤,然後按一 Open 下> in Workstation。 出現 Log Processing.cfg 窗口。

    您也可以從 Log Processing.cfg 開啟檔案 Transformation Dependency Map。 有關轉換相關性映射的資訊,請參 閱資料集配置工具

  4. 使用下表作為指南編輯配置檔案中的參數。

    在資料工作台 Log Processing.cfg 視窗中編輯檔案時,您可以使用快速鍵進行基本編輯功能,包括剪下(Ctrl+x)、複製(Ctrl+c)、貼上(Ctrl+v)、復原(Ctrl+z)、重做(Ctrl+Shift+z)、選取區段(按一下+拖曳),並選取所有(Ctrl+a)。 您也可以使用快速鍵,將一個設定檔()的文字複製並貼到另 .cfg一個設定檔。

    注意

    繼承 Log Processing Dataset Include 的配置檔案包含下表中所述參數的子集以及一些其他參數。 請參閱 資料集包含檔案

    參數 說明
    記錄來源 資料來源。 請參閱 記錄來源
    結束時間

    選填。篩選資料以包含時間戳記最多但不包含此時間的記錄項目。 Adobe建議您目前使用下列其中一種格式:

    • 2013年1月1日美國東部夏令時間
    • 2013年1月1日HH:MM:SS GMT

    例如,指定「2013年7月29日美國東部夏令時間00:00:00」作為「結束時間」時,會包含截至2013年7月28日(美國東部夏令時間下午11:59:59)的資料。 請參閱 資料篩選 器。

    您必須指定時區。 如果未指定,時區不預設為GMT。 如需資料工作台伺服器支援的時區縮寫清單,請參閱時區 代碼

    注意: 感測器、日誌檔案和XML源的「使 開始/結束時間」參數與此參數相關。 請參閱「記錄來 源」中討 論這些來源類型的章節。

    欄位 選填。Adobe建議在一或 多個 記錄處理資料集 中定義欄位包含 檔案。 請參閱 記錄處理資料集包含檔 案。
    組最大密鑰位元組數

    伺服器可針對單一追蹤ID處理的事件資料量上限。 從資料集建構程式中篩選超過此限制的資料。 當鍵拆分處於活動狀態時,此值必須設定為2e6,當鍵拆分不活動時,此值必須設定為1e6。 請參 閱密鑰分割

    注意: 不要在未諮詢Adobe的情況下變更此值。

    雜湊閾值

    選填。用於隨機行子採樣的採樣因子。 若設為數字n,則每n個追蹤ID中只有一個會進入資料集,將資料集中的列總數減少n倍。

    若要建立需要100%正確率的資料集(亦即包含所有列),您可將雜湊臨界值設為1。

    值:

    雜湊臨界值= 1 (100%的資料包含所有列)。

    雜湊臨界值= 2 (資料的1/2,並包含一半的列)。

    雜湊臨界值= 3 (資料的1/3,並包含三列其中一列,但在「查詢完成」中四捨五入至34%)

    雜湊臨界值= 4 (每4個資料中有1/4,並包含每4列1行。)

    注意: 使用雜湊 閾值= 8可 提供1/8的資料,即12.5%。 不過, 此值 的查詢完成值四捨五入為13%。 其他範例包 括雜湊臨界值= 6, 可產生17%的查詢解析度。 雜湊 臨界值= 13可 產生8%的查詢解析度。

    如果 在Log Processing.cfg和 Transformation.cfg檔案中都指定了「雜湊臨界值」,則 不會依序套用它;任一配置檔案中設定的最大值都適用。 請參閱 資料篩選 器。

    日誌條目條件 選填。定義將日誌條目納入資料集的規則。 請參 閱記錄條目條 件。
    重新處理

    選填。您可在此處輸入任何字元或字元組合。 更改此參數並將檔案保存到資料工作台伺服器電腦會啟動資料重新處理。

    請參 閱重新處理和重新轉 換。

    分割關鍵時段空間

    關鍵拆分涉及的參數。 當密鑰拆分處於活動狀態時,其值應為6e6。 請參 閱密鑰分割

    注意: 不要在未諮詢Adobe的情況下變更此值。

    拆分鍵位元組

    關鍵拆分涉及的參數。 當鍵拆分處於活動狀態時,其值應為1e6;當鍵拆分不活動時,其值應為0。 請參 閱密鑰分割

    注意: 不要在未諮詢Adobe的情況下變更此值。

    拆分鍵空間比

    關鍵拆分涉及的參數。 當鍵拆分處於活動狀態時,其值應為10。 請參 閱密鑰分割

    注意: 不要在未諮詢Adobe的情況下變更此值。

    階段

    選填。可用於記錄處理資料集的處理階 段名稱包括 檔案。 處理階段提供了一種對「日誌處理資料集包含」檔案中定 義的轉換排序的 方法。 如果您已在多個日誌處理資料集包含檔案中定義了一個或多個轉換,並且希望在日誌處理過程中 在特定點執行特定轉換,則此參數非常有用。

    此處列出階段的順序決定了日誌處理資料集包含檔案中 轉換在日誌處理 期間的執行順序。 預處理和後處理是內建階段。 預處理始終是第一階段,後處理則是最後階段。 依預設,有一個名為「預設」的命名階段。

    若要新增處理階段

    • 在「 Log Processing.cfg」視窗 中,以滑鼠右鍵按一下「 Stages」(階段),然後按一下「Add New > Stage」(新增>階段)。
    • 輸入新階段的名稱。

    刪除現有處理階段

    • 按一下右鍵要刪除的階段所對應的編號,然後按一下 < #stage_number >

    注意: 當您在「記錄處 理資 料集包含檔案」中指定 「舞台」時,舞台名稱必須與您在此處輸入的名稱完全相符。 請參閱 資料集包含檔 案。

    開始時間

    選填。篩選資料,以包含目前或之後具有時間戳記的記錄項目。 Adobe建議您目前使用下列其中一種格式:

    • 2013年1月1日美國東部夏令時間
    • 2013年1月1日HH:MM:SS GMT

    例如,指定「2013年7月29日美國東部夏令時間00:00:00」作為「開始時間」時,會包含從2013年7月29日美國東部夏令時間12:00:00開始的資料。 請參閱 資料篩選 器。

    您必須指定時區。 如果未指定,時區不預設為GMT。 如需資料工作台伺服器支援的時區縮寫清單,請參閱時區 代碼

    注意: 感測器、日誌檔案和XML源的「使 開始/結束時間」參數與此參數相關。 請參閱「記錄來 源」中討 論這些來源類型的章節。

    時區

    選填。用於日誌處理期間時間轉換的資料工作台伺服器的時區(例如由x-local-timestring欄位表示的轉換)。

    注意: 如果要在資料集構建的日誌處理階段訪問轉換的時間欄位,則必須指定時區。 否則,資料工作台伺服器會在事件記錄檔中記錄錯誤。

    請參 閱時區

    轉換 選填。Adobe建議在一或多個記錄處理資料集包含檔案中,定 義記錄處理的 轉換。 請參閱 記錄處理資料集包含檔 案。
  5. 按一下右鍵 (modified) 窗口頂部,然後按一下 Save

  6. 在中, Profile Manager按一下右鍵列中的復 Log Processing.cfg選 User 標籤,然後按一下 Save to > <dataset profile name >使本地更改生效。 重新處理資料是在同步資料集描述檔後開始。

    注意

    請勿將修改的設定檔儲存至Adobe提供的任何內部設定檔,因為當您安裝這些設定檔的更新時,會覆寫您所做的變更。

    如需重新處理資料的詳細資訊,請參閱重新 處理和重新轉換

本頁內容