云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > 多元回归分析中变量的选择 - SPSS的应用毕业论文

多元回归分析中变量的选择 - SPSS的应用毕业论文

  • 62 次阅读
  • 3 次下载
  • 2025/12/2 23:31:29

??(X?X)?1X?Y?pppp?p2??1Y?[I?Xp(Xp?Xp)?1Xp]Yn?R(Xp)

?)???(x1,?xp)?(xp?1,?xt)??? 上的预测值为 在x?(x?pxq1.2国内外研究现状

在科学技术飞速发展的今天,统计学广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。今天的统计学已展现出强有力的生命力。在我国,社会主义市场经济体制的逐步建立,实践发展的需要对统计学提出了新的更多、更高的要求。随着我国社会主义市场经济的成长和不断完善,统计学的潜在功能将得到更充分更完满的开掘。在应用回归分析去处理

实际问题时,回归自变量选择是首先要解决的重要问题。通常,在做回归分析时,人们根据所研究问题的目的,结合经济理论罗列出对因变量可能有影响的的一些因素作为自变量引进回归模型,其结果是把一些对因变量影响很小的,有些甚至没有影响的自变量也选入了回归模型中,这样一来,不但计算量变大,而且估计和预测的精度也会下降。此外,如果遗漏了某些重要变量,回归方程的效果肯定不好。在一些情况下,某些自变量的观测数据的获得代价昂贵,如果这些自变量本身对因变量的影响很小或根本没有影响,我们不加选择的引进回归模型,势必造成观测数据收集和模型应用的费用不必要的加大。因此,在应用回归分析中,对进入模型的自变量作精心的选择是十分必要的。

SPSS软件作为当今国际上运用广泛的统计分析软件,因其具有自动统计绘图、数据的深入分析、易学易用、功能齐全等特点,在各个领域得到了迅速普及,并成为各行业管理组织提高管理水平、形成科学决策的重要手段。然而,我国对该软件的理解和运用还处于早期应用阶段,对其功能的研究开发与实际生活当中的运用与西方发达国家相差甚远。特别是在管理决策方面,管理者对客观现实的准确把握对于决策起着至关重要的作用,他们花费大量人力、物力、财力收集统计数据,但是由于没有进行深度分析而浪费,或者仅仅利用SPSS软件进行简单分析而未进行深度开发,致使所得信息有限、各信息间的关系不明确,最终导致管理者的判断出现偏差。

第二章案例分析一:淘宝交易额的研究

2.1 数据的来源及变量的解释

为研究淘宝网未来发展趋势,从新浪官方微博淘宝数据魔方中获得淘宝2009年聚划算中购物群众的年龄比例作为定性数据,进行研究年龄对淘宝购物的影响。并在新浪财经网上获得淘宝网自2005年到2012年的淘宝交易额以及淘宝注册人数的数据。在中

商情报局里获得我国近网络普及度等数据并从国家统计年鉴中选取统计指标居民消费水平。

淘宝注册人数()在一定程度上反应了网络购物的群众的人数,反应了当今社会网络购物的普遍性。同时淘宝的注册人数也展现了人们对网络购物的认可度,换言之也就是说接受了网络购物并会在网上进行消费,是对网络购物很大程度上的支持。 我国网络普及度()是指我国近几年网络在我国普及的范围,这一块更好的反映了网络对居民网络消费的影响,因为网络是网络消费的必要条件。我国网络普及度反映的是在我国日趋发展的经济下,网络也得到了普遍的广泛,人们对网络的接受程度,信任程度也是直接影响到淘宝的网络购物。

居民消费水平()是指居民在物质产品和劳务的消费过程中,对满足人们生存、发展和享受需要方面所达到的程度。通过消费的物质产品和劳务的数量和质量反映出来。居民消费水平是指居民在物质产品和劳务的消费过程中,对满足人们生存、发展和享受需要方面所达到的程度。它主要通过消费的物质产品和劳务的数量和质量来反映。 居民消费水平的提高也能很好的展现在网络消费上作出的贡献。

通过对以上这三个定量数据的研究来其与淘宝交易额的关系,从而研究淘宝未来的发展趋势以及优劣态。 原始数据如下:

由于数据之间单位的不同,为了消除量纲的影响,把数据标准化进行处理,得到如下标准化的数据(所有取值保留了两位小数):

2.2相关分析

2.2.1散点图

对y与各个变量作出散点图

(1)淘宝注册人数与y的相关性散点图:

(2)网络普及度与淘宝网交易总额的相关性检验:

(3)我国居民消费水平与淘宝交易的相关性检验:

由以上三个散点图可知,其所有的点均落在了左上至右下的一条直线上,表明了数据之间存在显著相关关系。所以我们还需要对数据进行进一步的分析,得到确切的答案。 2.2.2计算相关系数

(1)复相关系数r是用来衡量回归直线对于观察值配合的密切程度,即用来衡量因变量y与自变量,,之间相关的密切程度。以下是用SPSS对数据进行相关性分析,得到如下的相关系数图

解析:图中有带“**”号的结果表明有关的两变量在0.01的显著性水平下显著相关,由上图可知,y与的相关系数为0.992>0,表示呈一定的线性关系,相关系数检验对应的概率P值为0.000,小于显著性水平0.05,说明淘宝交易额与淘宝注册人数之间相关性显著。y与的相关系数为0.901>0,表示呈一定的线性关系,相关系数检验对应的概率P值为0.002,小于显著性水平0.05,说明淘宝交易额与我国网络普及度之间相关性显著。y与的相关系数为0.965>0,表示呈一定的线性关系,相关系数检验对应的概率P值为0.000,小于显著性水平0.05,说明淘宝交易额与居民消费水平之间相关性显著。 综上所述通过SPSS得出的相关系数的矩阵得到为:

0.992 =0.901 =0.965 由以上数据可以看出,各列之间存在正相关关系。即淘宝网注册人数、我国网络普及度、我国居民消费水平与淘宝交易总额y存在正相关关系。

(2)计算偏相关系数:在多变量的情况下,变量之间的相关系数是相当复杂的。任意两个变量之间都有可能存在着相关关系,因此,只知道被解释变量与解释变量的总的相

  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
本文作者:...

共分享92篇相关文档

文档简介:

??(X?X)?1X?Y?pppp?p2??1Y?[I?Xp(Xp?Xp)?1Xp]Yn?R(Xp) ?)???(x1,?xp)?(xp?1,?xt)??? 上的预测值为 在x?(x?pxq1.2国内外研究现状 在科学技术飞速发展的今天,统计学广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。今天的统计学已展现出强有力的生命力。在我国,社会主义市场经济体制的逐步建立,实践发展的需要对统计学提出了新的更多、更高的要求。随着我国社会主义市场经济的成长和不断完善,统计学的潜在功能将得到更充分更完满的开掘。在应用回归分析去处理实际问题时,回归自变量选择是首先要解决的重要问题。通常,在做回归分析时,人们根据所研究问题的目的,结合经济理论罗列出对因变量可能有影响的的一些因

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com