当前位置:首页 > 第03章 补充案例
第二章课后习题
1.现选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等9个内陆边远省区。选取人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等五项能够较好的说明各地区社会经济发展水平的指标,验证一下边远及少数民族聚居区的社会经济发展水平与全国平均水平有无显著差异。
边远及少数民族聚居区社会经济发展水平的指标数据
地区 内蒙古 广西 贵州 云南 西藏 宁夏 新疆 甘肃 青海 人均GDP(元) 5068 4076 2342 4355 3716 4270 6229 3456 4367 三产比重(%) 31.1 34.2 29.8 31.3 43.5 37.3 35.4 32.8 40.9 人均消费(元) 2141 2040 1551 2059 1551 1947 2745 1612 2047 人口增长(%) 8.23 9.01 14.26 12.1 15.9 13.08 12.81 10.04 14.48 文盲半文盲(%) 15.83 13.32 28.98 25.48 57.97 25.56 11.44 28.65 42.92 资料来源:《中国统计年鉴(1998)》,北京,中国统计出版社,1998。
五项指标的全国平均水平为:
?0?(6212.01 32.87 2972 9.5 15.78)?
解:(1)先利用SPSS软件检验各变量是否遵从多元正态分布(见输出结果1-1)
输出结果1-1
正态性检验 Kolmogorov-Smirnov 统计量 人均GDP 三产比重 人均消费 人口增长 文盲半文盲 .219 .145 .209 .150 .246 Df 9 9 9 9 9 Sig. .200 .200 .200 .200 .124 ****aShapiro-Wilk 统计量 .958 .925 .873 .949 .898 df 9 9 9 9 9 Sig. .781 .437 .131 .682 .242 *. 这是真实显著水平的下限。 a. Lilliefors 显著水平修正
上表给出了对每一个变量进行正态性检验的结果,因为该例中样本数n=9,
所以此处选用Shapiro-Wilk统计量。则Sig.值分别为0.781、0.437、0.131、0.682、0.242均大于显著性水平,由此可以知道,人均GDP、三产比重、人均消费、人口增长、文盲半文盲这五个变量组成的向量均服从正态分布,即我们认为这五个指标可以较好对各地区社会经济发展水平做出近似的度量。 (2)提出原假设及备选假设
H0:???0
H1:???0
(3)做出统计判断,最后对统计判断作出具体的解释
SPSS的GLM模块可以完成多元正态分布有关均值与方差的检验。依次点选Analyze?General Linear Mode?lMultivariate……进入Multivariate对话框,将人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等这五项指标选入Dependent列表框,将分类指标选入Fixed Factor(s)框,点击OK运行,则可以得到如下结果(见输出结果1-2)。
输出结果1-2 主体间因子 分类
1.00 2.00
值标签
边远及少数民族聚居区社会经济发展水平 全国经济平均发展水平
N 9 1
多变量检验
效应
Pillai 的跟踪
截距
Hotelling 的跟踪 Roy 的最大根 Pillai 的跟踪
分类
Hotelling 的跟踪 Roy 的最大根
a. 设计 : 截距 + 分类 b. 精确统计量
5.037 5.037 Wilks 的 Lambda
102.482 102.482 .834 .166 Wilks 的 Lambda
值 .990 .010 F 81.986 81.986 81.986 81.986 4.029 4.029 4.029 4.029 bbbbbbbba
假设 df
5.000 5.000 5.000 5.000 5.000 5.000 5.000 5.000 误差 df
4.000 4.000 4.000 4.000 4.000 4.000 4.000 4.000 Sig.
.000 .000 .000 .000 .101 .101 .101 .101 上面第一张表是样本数据分别来自边远及少数民族聚居区社会经济发展水
平、全国的个数。第二张表是多变量检验表,该表给出了几个统计量。由Sig.值可以看到,无论从哪个统计量来看,两个分类的经济发展水平是无显著差别的。实际上,GLM模型是拟合了下面的模型:
Y??0??1X??
式中
? Y?(人均GDP? 第三产业比重 人均消费支出 人口自然增长率 文盲半文盲)X?分类
上面多变量检验表实际上是对该线性模型显著性的检验,此处有常数项?0是因为不能肯定模型过原点。而模型没有通过显著性检验,意味着分类中的不同取值对Y的取值无显著影响,也就是说,不同分类的经济发展水平是相同的。
但是,在实际中,我们往往更希望知道差别主要来自哪些分类,或者不同分类经济发展水平的比较。对此,对GLM模块的选项作如下设置:在GLM主对话框中点击Contrasts…按钮进入Contrasts对话框,在Change Contrasts框架中打开Contrasts右侧的下拉框并选择Simple,此时下侧的Reference Category被激活,默认是Last被选中,表明边远及少数民族聚居区社会经济发展水平与全国平均发展水平作比较,点击Change按钮,Continue继续,OK进行,得到如下结果(见输出结果1-3)
输出结果1-3
对比结果(K 矩阵)
分类 简单对比
人均GDP
三产比重
对比估算值 假设值
差分(估计 - 假设)
级别 1 和级别 2
标准 误差 Sig.
差分的 95% 置信区下限 间
a. 参考类别 = 2
上限
-2003.232 0 -2003.232 1129.265 .114 -4607.321 600.857 2.274 -1006.111 0 0 a
因变量
人均消费 人口增
长 2.712 0 2.712 2.761 .355 -3.655 9.079 文盲半文
盲 12.014 0 12.014 15.688 .466 -24.162 48.190 2.274 -1006.111 4.912 .656 395.860 .035 -9.053 -1918.967 13.602 -93.256 见输出结果1-3表示
(1)在显著性水平??0.05的水平下,可以看到Sig.值分别为0.114、0.656、0.035、0.355、0.466,由此我们可以知道边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均消费存在显著差别,即全国的平均人均消费大于边远及少数民族聚居区人均消费,相差值为1006.111元。人均GDP、三产比重、人口增长率、文盲半文盲等指标无明显差别。
(2)在显著性水平??0.01的水平下,可以看到Sig.值分别为0.114、0.656、0.035、0.355、0.466均大于显著性水平?,我们可以看出边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均GDP、三产比重、人均消费、人口增长率、文盲半文盲等指标无明显差别。
输出结果1-4
多变量检验结果
Pillai 的跟踪 Wilks 的 lambda Hotelling 的跟踪 Roy 的最大根 a. 精确统计量
值 .834 .166 5.037 5.037 F 4.029 4.029 4.029 4.029 aaaa
假设 df
5.000 5.000 5.000 5.000 误差 df
4.000 4.000 4.000 4.000 Sig. .101 .101 .101 .101 输出结果1-4是上面多重比较可信性的度量,由Sig.值可以看到,比较检验是可信的。
2、为研究某系列杀虫剂的杀虫效果,随机抽取一批标准试验田分别使用该系列三种不同杀虫剂(1、2、3),结果如spss所示。试比较杀虫剂对玉米和棉花的作用,并分析杀虫剂与农作物是否存在交互作用。 解:在SPSS中依次选择:
分析?一般线性模型?多变量后将效果1和效果2选入因变量中,将杀虫剂和农作物选入固定因子对话框中,在对比对话框中,将杀虫剂用差值进行对比;在绘制中,将杀虫剂选入水平轴,农作物选入单图;将杀虫剂进行两两比较;在选型对话框中进行方差齐性检验,得到以下输出结果:
共分享92篇相关文档