当前位置:首页 > 北航数理统计判别分析大作业
数理统计 (课程大作业2)
聚类和判别分析
学 院: 机械工程学院
专 业: 材料加工工程
日期:2014年12月22日
摘要:本文介绍聚类与判别方法,然后结合实际,依据各地区居民消费水平(元)、社会固定资产投资(亿元)、人均地区生产总值(元)、政府消费支出(亿元)、城镇居民人均总收入(元/人)5个与经济发展水平相关联的指标,对全国28个省、自治区、直辖市进行聚类分析,并对剩下的三个省市进行判别分析,以此对我国各地区的经济发展水平进行分类,并对分类的结果进行了分析。 关键字:经济类型 SPSS 聚类分析 判别分析
1 引言
中华人民共和国成立后,通过有计划地进行大规模的社会主义建设,中国已成为世界上最具有发展潜力的经济大国之一,人民生活总体上达到小康水平。按预定计划,到2010年,中国将建立起比较完善的社会主义市场经济体制;到2020年,建立起比较成熟的社会主义市场经济体制。
但是,我国的经济发展还不太均衡,地区性差异十分显著,尤其是东西部发展十分不同步。近年来,这种不均衡引起了人们的注意。新中国成立至1978年的30年间,中国政府一直致力于平衡发展战略,各种投资政策和财政支付转移明显地向边远和落后地区倾斜,然而效果不佳,付出的代价非常大。自1978年实行改革开放以后,中国政府在区域经济发展战略上来了一个大转变,从平衡发展战略转向不平衡发展战略,优先发展沿海地区,发展和开放的政策明显向沿海地区倾斜,使得沿海地区得以迅速发展起来,也迅速地拉大了沿海与内地的经济发展差距.从地区生产总值来看,2003年广东省为13626亿元,约相当于3个湖南(4639亿元)或10个贵州(1365亿元)或35个青海(390亿元).从人均地区生产总值来看,2003年浙江为20147亿元,3倍于江西(6678元),4倍于甘肃,5.6倍于贵州。
本文就是在这样的背景下提出来的,使用SPSS Statistics 19.0这一统计软件,利用国家统计局公布的《中国统计年鉴2013》中提供的2012年我国各地区经济发展的数据,依据各地区居民消费水平(元)、社会固定资产投资(亿元)、人均地区生产总值(元)、政府消费支出(亿元)、城镇居民人均总收入(元/人)5个与经济发展水平相关联的指标,对全国28个省、自治区、直辖市进行聚类分析,并对剩下的三个省市进行判别分析,以此对我国各地区的经济发展水平进行分类,并对分类的结果进行了分析。
1
2 数据采集
本文数据来源于《中国统计年鉴2013》,具体数据见表1
表 1 源数据 地区 北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆
社会固定资居民消费人均地区生政府消费支城镇居民人均总产投资(亿水平(元) 产总值(元) 出(亿元) 收入(元/人) 元) 6112.4 30349.5 87475 4451.8 36468.75 7934.8 22984.0 93173 1698.7 29626.41 19661.3 10749.4 36584 3272.7 20543.44 8863.3 10829.0 33628 1605.4 20411.71 11875.7 15195.5 63886 2466.9 23150.26 21836.3 17998.7 56649 2178.8 23222.67 9511.5 12276.3 43415 1566.2 20208.04 9694.7 11600.8 35711 2812.7 17759.75 5117.6 36892.9 85373 2807.3 40188.34 30854.2 19452.3 68347 7329.0 29676.97 17649.4 22844.7 63374 4013.3 34550.30 15425.8 10977.7 28792 1876.3 21024.21 12439.9 16143.9 52763 1854.8 28055.24 10774.2 10572.9 28800 1560.5 19860.36 31256.0 15095.0 51768 5960.3 25755.19 21450.0 10380.3 31499 3584.0 20442.62 15578.3 12283.0 38572 2897.3 20839.59 14523.2 11739.5 33480 2397.7 21318.76 18751.5 21823.3 54095 6241.8 30226.71 9808.6 10519.5 27952 1612.2 21242.80 2145.4 10634.5 32377 448.3 20917.71 8736.2 13655.4 38914 1389.3 22968.14 17040.0 11280.2 29608 2831.4 20306.99 5717.8 8372.0 19710 1039.7 18700.51 7831.1 9781.6 22195 1763.2 21074.50 670.5 5339.5 22936 289.6 18028.32 12044.5 11852.2 38564 1944.9 20733.88 5145.0 8542.0 21978 1131.9 17156.89 1883.4 10289.1 33181 410.2 17566.28 2096.9 12120.4 36394 404.2 19831.41 6158.8 10675.1 33796 1891.8 17920.68 三 聚类分析
3.1 聚类分析过程
2
首先将数据导入SPSS中,并剔除待分析的河北、浙江、新疆三省数据。 表3所示的为聚类分析的汇总结果:
表3 案例处理汇总 案例 有效 N 28 百分比 100.0 N 0 缺失 百分比 .0 N 28 总计 百分比 100.0 a. 平方 Euclidean 距离 已使用 b. 平均联结(组之间)
从表3中可以看到28个样本的数据全都有效,均用于系统聚类分析过程。表中列出了有效样本、缺失样本和样本总数的个数和百分数。
表4显示的是样本的凝聚过程。对本文选取的28个样本,系统进行了27步分析,并在每一步中给出了凝聚过程中两类之间的相关系数。
表4 聚类表 群集组合 阶 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 群集1 12 10 22 19 15 3 19 22 10 6 10 6 22 3 1 10 5 5 3 群集2 18 21 26 27 25 7 28 23 16 20 12 15 24 6 8 14 17 11 19 系数 3568152.164 4789624.428 7892087.384 12067895.815 13591635.444 14116255.332 19190996.708 21666276.496 23240192.308 30411453.520 41848265.896 42054641.615 53920958.101 54768430.052 64763844.618 81191025.397 96231017.522 1.141E8 1.218E8 首次出现阶群集 群集1 0 0 0 0 0 0 4 3 2 0 9 10 8 6 0 11 0 17 14 群集2 0 0 0 0 0 0 0 0 0 0 1 5 0 12 0 0 0 0 7 下一阶 11 9 8 7 12 14 19 13 11 12 16 14 23 19 22 20 18 21 20
3
共分享92篇相关文档