当前位置:首页 > spss软件 决策树
?
在关闭时如果Tree节点没有弹出对话框让你存储改动,这说明原有的设置没有被修改,这是你要重新打开这个节点并重新修改设置.
6. 重新运行Tree节点并浏览结果.
这个最佳树有 8 个树叶。在验证数据上的精度略有下降,为88.56%. 7. 选择 View ? Tree 看树图.
注意在DEBTINC上的第一个裂分下面有4个分枝. 8. 浏览后关闭树图及节点窗口. 比较模型
Assessment 节点用于比较模型.
1. 要从Assessment 节点运行框图, 右击Assessment 节点并选择Run. 2. 在弹出的对话框中选 Yes查看结果.
3. 在 Assessment Tool 窗口, 点击并拖拽鼠标把两个模型都选上. 4. 选择Tools ? Lift Chart.
? 右击Tool Name框内空白处,选择format,选择model name
缺省给出的是一个 Cumulative %Response(累积因变量%) 图。根据缺省,人群按预测的因变量概率划分为10个等分组,然后画出实际的因变量百分数(即Y轴)。要看实际值,点击View Info 工具然后点击模型对应的折线。点击靠近图形左上角的Tree-2 线,得到%Response 为 82.06, 含义是什么呢?
要解释Cumulative %Response 图,需知道它是如何生成的.
? 就这个例子而言,响应人(responder)被定义为一个欺诈贷款的人 (BAD=1). 对每一个人,拟和的模型(在此是一个决策树)给出了此人将来会欺诈贷款的概率预测。把所有的记录按响应的预测概率从大到小排序. ? 把人分成有序组,每一组包含大约10% 的数据记录.
? 使用目标变量BAD, 计算每一组实际响应人的百分数c.
如果模型有用,响应者(欺诈者)的比例在响应预测概率高的组将会相对高。前面给出的累积响应曲线显示了前10%, 20%, 30%等实际响应者的百分数。在前 10%的组里, 80% 多的人是贷款欺诈者;在前 10%的组里, 欺诈者的比例下降到只有72%. 水平线代表的是用于比较的基准比率(大约20%), 这个比率是你随机抽样时预期的欺诈者百分数的估计. 上图给出的累积百分数,但你还可以选择图形左边Non-Cumulative旁边的圆钮查看每一个组里响应者的比例.
选择 Non-Cumulative 旁边的圆钮并查看图形. Cumulative %Response
Non-Cumulative %Response
Non-Cumulative 图形表明一旦预测概率的值在前20%以外,欺诈率要比你选一个随机样本所期望的欺诈率要低.
选择 Cumulative 然后选 Lift Value. 提升图描画的在不同标度上的相同信息。记得总体的响应率大约为20%。提升图可通过把每一个小组的响应率除以总体响应率得到。因此提升图描绘的是基于基础线的相对改进. Cumulative %Response
Cumulative Lift Value
我们知道在按预测概率排序的前10% 的组里欺诈者比例为82.06%. 82.06% 除以20% (baseline rate) 得到略大于4的数, 这表明你在这个组里会得到比相同人数的简单随机样本里4 倍多的欺诈者.
你可能会提出这样的问题:\每一个组里响应者占全部响应者的百分数是多少?\。这个百分数是用%Captured Response计算的。要查看计算结果,选择êptured Response旁边的圆钮。用 View Info 工具评价模型的性能。
你可以看到如果你拒绝申请者的百分数为
? 20%, 你可能挑出了大约70% 将会欺诈的人(提升比例是 3.5!). ? 40%,你可能挑出了大约80% 将会欺诈的人(提升比例大于2!).
共分享92篇相关文档