决策树选项

重要

阅读有关Data Workbench 生命周期终止公告.

“决策树”菜单包含各项功能,可以设置正类用例、过滤器、叶分配选项、混淆矩阵及其他高级选项。

工具栏按钮 描述
开始 单击以运行决策树算法并显示可视化。此选项处于灰显状态,直到存在输入的情况。
重置 清除输入和决策树模型并重置流程。
保存 保存决策树。您可以将决策树保存为不同的格式:
  • 预测标记语言 (PMML),它是基于 XML 的文件格式,被应用程序用于描述和交换决策树模型。
  • 文本,它显示简单列和行,其中包含 true 或 false、百分数、成员数和输入值。
  • 维度以及与预测结果元素对应的分支。
选项 请参阅下表了解“选项”菜单。
“选项”菜单 描述
设置正类用例 定义当前工作区选项作为模型的正类用例。如果没有选项存在,则清除用例。
设置人群过滤器 定义当前工作区选项作为模型的人群过滤器,并从满足此条件的访客中进行选择。默认为“每个人”。
显示复杂过滤器说明 显示定义的过滤器的说明。单击可查看正类用例和人群过滤器的过滤脚本。
隐藏节点 隐藏只有很少一部分人群的节点。仅当决策树显示时,才会显示此菜单命令。
混淆矩阵

单击选项 > 混淆矩阵以查看准确度、取消、精度和 F 得分值。越接近 100%,分数越高。

混淆矩阵使用值的组合提供了模型的四项准确度:

  • 实际正值 (AP)
  • 预测正值 (PP)
  • 实际负值 (AN)
  • 预测负值 (PN)

提示:这些数字的获取,是通过对保留的 20% 测试数据和已知为正确的答案应用结果评分模型得来。如果得分高于 50%,则预测为正类用例(与定义的过滤器匹配)。准确度 = (TP + TN)/(TP + FP + TN + FN),取消 = TP / (TP + FN),精度 = TP / (TP + FP)。

显示图例 允许您在决策树中切换图例键开关。仅当决策树显示时,才会显示此菜单命令。
高级 单击可打开“高级”菜单以深入使用决策树。请参阅下表以了解菜单选项。
高级菜单 描述
培训集大小

控制用于构建模型的培训集大小。较大的集合需要的培训时间较长,较小的集合需要的时间较短。

输入正规化

允许用户指定使用最低-最高还是使用 Z 评分技术来正规化模型中的输入。

SMOTE 过采样因子 当培训采样中正类用例不经常发生(小于 10%)时,使用 SMOTE 可以提供更多采样。此选项允许用户指示使用 SMOTE 多创建多少采样。
叶类分配阈值 允许您设置在树构建过程中叶的假定阈值。默认情况下,节点的所有成员必须一致,因为该节点将作为一个叶(修剪阶段前)。

在此页面上