当前位置:首页 > SAS数据挖掘实例
(3)
双击Insight节点,出现Insight Settings窗口
由于不同的数据源的数据量可能不同,而且有些数据源的数据量可能是非常巨大的,所以Insight节点默认抽取2000条数据记录来探索数据源,当数据源的记录数小于2000时,可以选择Insight Based On设置中的Entire data set来改变探索数据的样本数量。 (4)
单击Entire data set后关闭Insight Settings窗口,在弹出对话框中单击“是”保存设置
5.2.2 察看Insight节点输出结果
当设置完Insight节点之后,通过运行该节点可以查看探索数据的结果,其过程如下:
(1) 右单击Insight节点,在弹出菜单中选择Run运行该节点,运行过
程中节点的四周会变成绿色,运行完毕会有运行结果的提示对话框
(2) 单击“是”可以察看运行结果。Insight运行结果将数据源以二维表
视图的形式显示
(3) 单击SAS主菜单中的“分析”,选择下拉菜单中的“分布”,将弹出
选择察看分布的变量的窗口
(4) 单击第一个变量PURCHASE后将滚动条拖到最后一个变量,按住
Shift键单击最后一个变量SEX,当所有的变量都被选择上后单击“Y”按钮,然后确定,会出现所有变量的分布窗口。其中包括每个变量的分布图和一些重要的统计变量以及一组分位数。
在这个例子中我们重点要看的是DINING的分布。可以看到DINING的值从0到28,0值居多。那么我们要建立预测客户购买Dining产品倾向的模型,应该把目标锁定在目标变量Dining的值大于0的客户身上。
(5) 数据探索完毕,关闭分布窗口和EMDATA.VIEW_QMY窗口返回到EM工
作区。
准备建模数据
此例将准备建模数据阶段分成了四个环节:建立目标变量、设置目标变量、数据分割和替换缺失值。
建立目标变量
前面已经分析了我们的目标人群是Dining变量大于0的客户群,但是对于目前数据集SASUSER.CUSDET1中的Dining变量的值是从0到28的一个分布,而我们只关心Dining值大于或者小于0,所以这里要对Dining变量作个转换,让
大于0的Dining值为1。
EM中用来建立变量的工具是Transform Variables节点,步骤如下: (1)
将Transform Variables节点拖拽到工作区中Input Data Source节点的右侧连接Input Data Source节点到Transform Variables节点
(2)
双击Transform Variables节点,出现Transform variables窗口
(3)
单击工作区上方工具栏中的Create variable图标 Create Variable窗口
,出现
共分享92篇相关文档