阅读有关Data Workbench 生命周期终止公告.
“决策树”菜单包含各项功能,可以设置正类用例、过滤器、叶分配选项、混淆矩阵及其他高级选项。
工具栏按钮 | 描述 |
---|---|
开始 | 单击以运行决策树算法并显示可视化。此选项处于灰显状态,直到存在输入的情况。 |
重置 | 清除输入和决策树模型并重置流程。 |
保存 | 保存决策树。您可以将决策树保存为不同的格式:
|
选项 | 请参阅下表了解“选项”菜单。 |
“选项”菜单 | 描述 |
---|---|
设置正类用例 | 定义当前工作区选项作为模型的正类用例。如果没有选项存在,则清除用例。 |
设置人群过滤器 | 定义当前工作区选项作为模型的人群过滤器,并从满足此条件的访客中进行选择。默认为“每个人”。 |
显示复杂过滤器说明 | 显示定义的过滤器的说明。单击可查看正类用例和人群过滤器的过滤脚本。 |
隐藏节点 | 隐藏只有很少一部分人群的节点。仅当决策树显示时,才会显示此菜单命令。 |
混淆矩阵 | 单击选项 > 混淆矩阵以查看准确度、取消、精度和 F 得分值。越接近 100%,分数越高。 混淆矩阵使用值的组合提供了模型的四项准确度:
提示:这些数字的获取,是通过对保留的 20% 测试数据和已知为正确的答案应用结果评分模型得来。如果得分高于 50%,则预测为正类用例(与定义的过滤器匹配)。准确度 = (TP + TN)/(TP + FP + TN + FN),取消 = TP / (TP + FN),精度 = TP / (TP + FP)。 |
显示图例 | 允许您在决策树中切换图例键开关。![]() |
高级 | 单击可打开“高级”菜单以深入使用决策树。请参阅下表以了解菜单选项。 |
高级菜单 | 描述 |
---|---|
培训集大小 | 控制用于构建模型的培训集大小。较大的集合需要的培训时间较长,较小的集合需要的时间较短。 |
输入正规化 | 允许用户指定使用最低-最高还是使用 Z 评分技术来正规化模型中的输入。 |
SMOTE 过采样因子 | 当培训采样中正类用例不经常发生(小于 10%)时,使用 SMOTE 可以提供更多采样。此选项允许用户指示使用 SMOTE 多创建多少采样。 |
叶类分配阈值 | 允许您设置在树构建过程中叶的假定阈值。默认情况下,节点的所有成员必须一致,因为该节点将作为一个叶(修剪阶段前)。 |