当前位置:首页 > SAS数据挖掘实例
(4) (5)
在Name区域输入Dinebin,在Label区域输入Dining No/Yes 单击Define,出现Customize窗口
(6) (7)
在DINEBIN(N)=formula域中输入“dining〉0”
单击OK按钮,关闭Transform Variable窗口,选择“是”保存修改,则DINEBIN即为我们建立好的目标变量。 设置目标变量
EM实现对目标变量的设置使用的工具是Data Set Attributes节点 (1) 将Data Set Attributes节点拖放到Transform Variable节点右侧 (2) 连接Transform Variable节点到Data Set Attributes节点
(3) 双击Data Set Attributes节点,出现Data Set Attributes窗口 (4) 单击Variables标签
(5) 找到DINEBIN变量,右单击DINEBIN变量的New Model Role属性
(input值),选择弹出菜单中的Set New Model Role,选择target,则原来的input值变为target值
在这个建立和设置目标变量的过程中隐藏着一个问题。DINEBIN的值是建立在DINING的基础上的,而DINGING的值又是建立在另外三个变量KITCHEN, DISHES和 FLATWARE的基础上的,这将导致目标变量与这四个预测变量之间的完全线性相关。这样就产生了一个逻辑循环,即输入导出的预测值是我们已知的,也就是说这种输入的结果是我们通过已知变量就可以知道的,而失去了预测的意义。所以,在我们建立预测模型时必须将形成目标变量的四个变量排除在外。
(6) 在Data Set Attributes窗口中分别找到KITCHEN、DISHES、FLATWARE
和DINING变量,右键单击变量的New Model Role属性值,在弹出菜
单中选择Set New Model Role,选择rejected,即将KITCHEN、DISHES、FLATWARE 和DINING的New Model Role属性值改为rejected。
EM建立预测模型要求确定变量的数据类型。EM能够识别的数据类型有五种:unary——只有唯一值型、binary——只有两个值型、nominal——两个以上的无序非数字值型、 ordinal——多于两种情况的小于10的数值型和interval——大于10 的数值型,例如:
(7) 在Data Set Attributes窗口,右键单击DINEBIN变量的New
Measurement属性值,在弹出菜单中选择Set New Measurement,选择binary,则DINEBIN变量的New Measurement属性值被改为binary
在我们建模的时候,EM会默认目标事件为目标变量排序的第一个值,默认排序方法为升序。我们这里的目标变量DINEBIN只有0和1值,1值代表对厨房用品的购买。所以这里需要将目标变量按降序排列来锁定那些有购买倾向的客户群。
(8) 在Data Set Attributes窗口,单击Class Variables标签,找到
DINEBIN变量,右键单击变量的New Order属性值,选择Set New Order,选择Descending
当设置好目标变量的元数据特征(包括数据类型,排序等)后,下一步我们要对目标变量的商业属性进行设置。由于我们对目标变量的预测值将涉及到我们的商业决策,而任何商业决策都要承担一定的成本。建立数据挖掘预测模型,明
共分享92篇相关文档