当前位置:首页 > SAS数据挖掘实例
升降图可以形象的展现模型实施的效果,图中的蓝线表示的是源数据集中,有12%的客户的DINING字段〉0,这个数字代表了如果对所有的客户发出目录,将会有12%的客户相应。
图中黄色的曲线代表的是回归模型的预测效果,红色曲线代表决策树模型的预测效果。
模型会给每一个客户购买DINING产品的倾向打一个分,并将分数从高到低排列后,分为十个等份,图中的横坐标从左到右代表这十个等份,纵坐标代表不同打分的人群的相应率。
可以看出,当分别利用回归和决策树模型对客户进行打分排名后,回归模型前10%的客户响应率达到了30%以上,而决策树模型的前10%的客户响应率只达到25%多一点,如果公司希望扩大宣传力度,例如公司预选择30%的客户群进行宣传,那么利用决策树模型建模可以得到更高的响应率。
Lift Chart默认显示的是累计的响应率效果,可以通过单击升降图中,Bar Color for 上方的Non-Cumulative前面的圆圈查看非累积的升降图,即每个10%的人群的响应率,以便于公司对每个不同人群的定位。
(4) 关闭升降图,关闭Assessment窗口。
应用模型
抽取打分程序
在如上的建模过程中,假设我们将目标定位在10%的客户群,显然我们的最佳选择是回归模型,下面我们要把这个模型应用到所有的数据上面。EM提供了一个Score节点来实现对模型的评分代码进行评估、保存以及整合。
(1)
将Score节点拖到工作区中,放在Regression节点右边,连接Regression节点到Score节点
(2)
双击Score节点,出现Score窗口,在默认出现的Setting标签中选择第二项Apply training data score code to score data set
(3)
关闭窗口,保存修改。 引入原始数据源
当我们设置好Score节点之后,我们就可以对任何一个结构相同的数据源来进行打分,在这里,由于我们仍然使用样本数据源CUSTDET1。
(1)
将Input Data Source节点拖到工作区中,连接Input Data Source节点到Score节点
(2)
双击Input Data Source节点,选择SASUSER.CUSTDET1,单击Role右侧的下拉键头,在下拉菜单中选择SCORE
(3)
关闭窗口,保存修改。 查看结果
对整个源数据应用模型的结果可以通过Explore工具来查看,前面我们已经应用过一个Insight节点,这里我们介绍另外一个工具-Distribution Explorer节点的使用。
(1) 将Distribution Explorer节点拖到工作区中放在Score节点的下
方,连接Score节点到Distribution Explorer
在利用Distribution Explorer节点查看模型应用的效果之前必须先运行Score节点
(2) 右键单击Score节点,选择Run,Score节点四周会出现绿色方框,
运行完毕出现是否查看运行结果的对话框,选择否。
共分享92篇相关文档