当前位置:首页 > 数据挖掘实验报告1
实 验 报 告
所属课程名称 数据挖掘方法与应用 实 验 日 期 2012年 03月 08 日 班 级 09统计 学 号 09109003120 姓 名 楼杭波 指导教师 黄辉林
温
州 大 学
温州大学数学与信息科学学院
P40 2.1
一.打开数据集bnkserv.sta后,在data mining下选择Sequence,Association and Link Anaysis模块。
二.在Quick标签下单击Variables 按钮,并将Var1作为Sequenc ID,
Var2作为Multiple response。单击OK。
三.接着选择
Advanced,将最小支持度改为0.05
1
四.选择Sequence,将Maximum number of itemsets in a Sequence
的值改为40.单击Ok
五.出现如下结果窗口。可知CKING的频率最高,SVG第二高,ATM第三高。
2
六.单击Sequence rules 得到下表。可知其中序列规则If( CKING ) Then ( SVG ) 的支持度和置信度是最大的,分别是54.17345%和63.15098%。接着是CKING和ATM序列关联强度,支持度和置信度分别是36.19071%和42.18818然后是CKING,SVG和ATM的序列关联强度。 七.单击Rule graph以及单击Support graph,得到以图形表示的输出结果,同样可以得出CKING和SVG之间的序列关联是最强的。
3
Rule graphNode size: Relative support of each itemColor darkness: Relative confidenceAUTOMTGHMEQLCCCRDCD0.0850.632BodyCKCRDIRAMMDAATMSVGCKINGCKINGATMIRACDHMEQLCAUTOCCRDMTGSVGMMDACKCRDHeadSupport bar chartMin: support = 5.0%, confidence = 10.0%Max. size of an itemset = 10八.根据上述数据挖掘结果得出结论:ATM,SVG,CKING三种银行服务之间具有较强的关联,一般客户选择了其中一种服务的都会选择另两种服务中的一种或者两种。当然CKING和SVG两种服务之间有最强的关联度。
4
共分享92篇相关文档