編輯記錄處理組態檔

編輯資料集設定檔之Log Processing.cfg檔案的步驟。

  1. 在資料集設定檔中工作時,請開啟Profile Manager並按一下​Dataset​以顯示其內容。

    有關開啟和使用Profile Manager的資訊,請參閱​Data Workbench使用手冊

    注意

    資料集目錄中可能有記錄處理子目錄。 此子目錄包含已為一個或多個繼承配置檔案建立的Log Processing Dataset Include檔案。 請參閱資料集包含檔案

  2. 按一下右鍵Log Processing.cfg旁的複選標籤,然後按一下​Make Local。 User列中將顯示此檔案的複選標籤。

  3. 按一下右鍵新建立的複選標籤,然後按一下​Open > in Workstation。 出現Log Processing.cfg窗口。

    您也可以從Transformation Dependency Map開啟Log Processing.cfg檔案。 如需轉換相依性映射的相關資訊,請參閱資料集組態工具

  4. 使用下表作為指南編輯配置檔案中的參數。

    在Data Workbench視窗中編輯Log Processing.cfg檔案時,您可以使用快速鍵來編輯基本的編輯功能,包括剪下(Ctrl+x)、複製(Ctrl+c)、貼上(Ctrl+v)、還原(Ctrl+z)、重做(Ctrl+Shift+z)、選取區段(按一下+拖曳),以及選取全部(Ctrl+a)。 您也可以使用捷徑將文字從一個組態檔(.cfg)複製並貼到另一個組態檔。

    注意

    繼承的配置檔案的Log Processing Dataset Include檔案包含下表中描述的參數的子集以及一些附加參數。 請參閱資料集包含檔案

    參數 說明
    記錄來源 資料來源。 請參閱記錄來源
    結束時間

    選填。篩選資料以包含時間戳記最多但不包含此時間的記錄項目。 Adobe建議您暫時使用下列其中一種格式:

    • 2013年1月1日HH:MM:SS EDT
    • 2013年1月1日HH:MM:SS GMT

    例如,將2013年7月29日00:00:00 EDT指定為「End Time(結束時間)」 ,包括截至2013年7月28日EDT 11:59:59下午的資料。 請參閱資料篩選器

    必須指定時區。 若未指定,時區不會預設為GMT。 如需Data Workbench伺服器支援的時區縮寫清單,請參閱時區代碼

    注意: 感測器、日誌檔案和XML源的Use Start/End Times參數與此參數相關。 請參閱日誌源中討論這些源類型的部分。

    欄位 選填。Adobe建議在一或多個記錄處理資料集包含檔案中定義欄位 。 請參閱記錄處理資料集包含檔案
    組最大密鑰位元組數

    伺服器可針對單一追蹤ID處理的事件資料量上限。 超過此限制的資料會從資料集建構程式中篩選。 當密鑰拆分處於活動狀態時,此值必須設定為2e6;當密鑰拆分處於非活動狀態時,此值必須設定為1e6。 請參閱鍵拆分

    注意: 若沒有諮詢Adobe,請勿變更此值。

    雜湊臨界值

    選填。用於隨機行子採樣的採樣因子。 如果設為數字n,則每n個追蹤ID中就只有一個會進入資料集,將資料集中的列數減少n倍。

    若要建立需要100%準確度(即包含所有列)的資料集,您可將雜湊臨界值設為1。

    值:

    雜湊臨界值= 1 (包含所有列的資料佔100%)。

    雜湊臨界值= 2 (1/2的資料,且包含一半列)。

    雜湊臨界值= 3( 資料的1/3,包含三列其中一列,但在查詢完成中四捨五入為34%)

    雜湊臨界值= 4( 資料的1/4,且包含四列中的一列)。

    注意: 使用雜湊臨界值= 8 可提供1/8的資料,即12.5%。 不過,此值會捨入為13%的查詢完成值。 其他範例包括雜湊臨界值= 6 ,可產生17%的查詢解析度。 雜湊臨界值= 13 會產生8%的查詢解析度。

    如果在 Log Processing.cfg Transformation.cfg 檔案中均指定了 Hash Threshold ,則不會依序應用該檔案;任一設定檔案中設定的最大值即適用。 請參閱資料篩選器

    記錄項目條件 選填。定義將記錄項目納入資料集的規則。 請參閱記錄項目條件
    重新處理

    選填。您可以在此處輸入任何字元或字元組合。 變更此參數並將檔案儲存至Data Workbench伺服器電腦會起始資料重新處理。

    請參閱重新處理和重新轉換

    拆分鍵桶空間

    密鑰拆分中涉及的參數。 密鑰拆分激活時,其值應為6e6。 請參閱鍵拆分

    注意: 若沒有諮詢Adobe,請勿變更此值。

    拆分鍵位元組

    密鑰拆分中涉及的參數。 當密鑰拆分處於活動狀態時,其值應為1e6;當密鑰拆分處於非活動狀態時,其值應為0。 請參閱鍵拆分

    注意: 若沒有諮詢Adobe,請勿變更此值。

    拆分鍵空間比

    密鑰拆分中涉及的參數。 當金鑰分割作用中時,其值應為10。 請參閱鍵拆分

    注意: 若沒有諮詢Adobe,請勿變更此值。

    階段

    選填。可用於記錄處理資料集包含檔案的處理階段名稱。 處理階段提供了對記錄處理資料集包含檔案中定義的轉換進行排序的方法。 如果您已在多個記錄處理資料集包含檔案中定義了一或多個轉換,且您希望在記錄處理期間的特定時間點執行特定轉換,此參數將非常有用。

    您在此列出階段的順序會決定在記錄處理期間執行記錄處理資料集包含檔案中轉換的順序。 預處理和後處理是內建階段。 預處理一律為第一階段,後處理則一律為最後階段。 預設情況下,有一個名為Default的命名階段。

    新增處理階段的方式

    • Log Processing.cfg 窗口中,按一下右鍵階段 ,然後按一下 Add New > Stage
    • 輸入新階段的名稱。

    刪除現有處理階段

    • 按一下右鍵要刪除的階段對應的編號,然後按一下刪除< #stage_number

    注意: 在記錄處理資料集包含檔案中指定階段時,階段名稱必須與您在此輸入的名稱完全相符。 請參閱資料集包含檔案

    開始時間

    選填。篩選資料以包含此時間或之後具有時間戳記的記錄項目。 Adobe建議您暫時使用下列其中一種格式:

    • 2013年1月1日HH:MM:SS EDT
    • 2013年1月1日HH:MM:SS GMT

    例如,將「2013年7月29日美國東部夏令時間00:00:00」指定為「開始時間」,包括從2013年7月29日美國東部夏令時間12:00:00點開始的資料。 請參閱資料篩選器

    必須指定時區。 若未指定,時區不會預設為GMT。 如需Data Workbench伺服器支援的時區縮寫清單,請參閱時區代碼

    注意: 感測器、日誌檔案和XML源的Use Start/End Times參數與此參數相關。 請參閱日誌源中討論這些源類型的部分。

    時區

    選填。記錄處理期間,用於時間轉換的Data Workbench伺服器的時區(例如x-local-timestring欄位所代表的轉換)。

    注意: 如果您想要在資料集建構的記錄處理階段期間存取轉換的時間欄位,則必須指定時區。 否則,Data Workbench伺服器會在事件記錄中記錄錯誤。

    請參閱時區

    轉換 選填。Adobe建議在一個或多個日誌處理資料集包含檔案中定義日誌處理的轉換。 請參閱記錄處理資料集包含檔案
  5. 按一下右鍵窗口頂部的​(modified) ,然後按一下​Save

  6. 在Profile Manager中,按一下右鍵User列中Log Processing.cfg的複選標籤,然後按一下​Save to > <dataset profile name> ,使本地所做的更改生效。 同步資料集設定檔後,就會開始重新處理資料。

    注意

    請勿將修改的設定檔儲存至Adobe提供的任何內部設定檔,因為您安裝這些設定檔的更新時,變更會遭到覆寫。

    如需重新處理資料的詳細資訊,請參閱重新處理和重新轉換

本頁內容