決策樹選項

重要

深入了解Data Workbench 終止公告.

「決策樹」菜單包含設定正面使用案例、篩選器、葉分佈選項、混淆矩陣和其他高級選項的功能。

工具欄按鈕 說明
開始 按一下以執行決策樹演算法並顯示視覺效果。 在有輸入項之前,這會變灰。
重設 清除輸入和決策樹模型,並重設進程。
儲存 保存決策樹. 您可以以不同格式保存決策樹:
  • 預測標籤語言(PMML),一種基於XML的檔案格式,供應用程式描述和交換決策樹模型。
  • 文字 顯示簡單的列和行,包括true或false、百分比、成員數和輸入值。
  • A Dimension 與預測結果元素對應的分支。
選項 請參閱下表中的「選項」功能表。
選項功能表 說明
設定正大小寫 將當前工作區選項定義為模型的「正大小寫」。 如果沒有選取項目,則清除大小寫。
設定母體篩選 將目前的工作區選取項目定義為模型的母體篩選,且將從滿足此條件的訪客中提取。 預設值為「所有人」。
顯示複雜篩選器說明 顯示已定義篩選器的說明。 按一下以檢視正面大小寫和填入篩選的篩選指令碼。
隱藏節點 隱藏僅佔人口一小部分的節點。 僅當顯示決策樹時才顯示此菜單命令。
混淆矩陣

按一下 選項 > 混淆矩陣 查看「正確性」、「召回率」、「精確度」和「F分數」值。 接近100%越好。

「混淆矩陣」使用值的組合提供模型的四種準確度計數:

  • 實際正數(AP)
  • 預計正數(PP)
  • 實際負數(AN)
  • 預計負數(PN)

提示:通過應用20%測試資料的最終評分模型來獲取這些數字,該模型已被預留,並且已被稱為真實答案。 如果分數大於50%,則會預測為正面大小寫(符合定義的篩選)。 然後,準確度=(TP + TN)/(TP + FP + TN + FN),召回率= TP /(TP + FN),精度= TP /(TP + FP)。

顯示圖例 可讓您開啟或關閉決策樹中的圖例鍵。 僅當顯示決策樹時才顯示此菜單命令。
進階 按一下以開啟「高級」菜單,以深入使用決策樹。 有關菜單選項,請參閱下表。
進階功能表 說明
訓練集大小

控制用於模型建立的訓練集大小。 較大的集需要更長的時間來訓練,較小的集需要更少的時間。

輸入標準化

可讓使用者指定是使用最小值或Z分數技術,將輸入標準化至模型。

SMOTE過抽樣系數 當正面案例在訓練樣本中不經常發生時(小於10%),則使用SMOTE提供額外樣本。 此選項可讓使用者指出要使用SMOTE建立多少個範例。
葉類分佈閾值 可讓您在樹狀結構建立過程中設定假定的葉的臨界值。 預設情況下,節點的所有成員必須相同,才能成為葉(在剪枝階段之前)。

本頁內容