当前位置:首页 > 基于R语言的上海房价预测模型
lines(t,yy) 得到如图:
ym25000
1998200020022004t2006200820102.3 回归方程的检验
对系数进行显著性检验,由结果可知,a1的均方误差为6.608e-12,b的均方误差为3.296e-15,而a1和b的P值均小于0.05,拒绝原假设,即认为ym与t之间存在指数关系。
对方程进行检验,残差的标准差为4.972e-14,而相关系数R2?1,P值小于0.05,效果明显,故拒绝原假设,即认为ym与t之间存在指数关系。
第三章 影响房价的多因素的多元线性回归模型
3.1 模型的建立
ym: 上海商品房房产均价;x1:人均生产总值;x2:人均可支配收入;x3:商品零售价格指数;x4:常住人口;x5:住房竣工面积;x6:住宅投资总额;x7:居民居住消费价格指数;则建立这7个变量关于ym的多元线性回归模型:
ym??0??1x1??2x2??3x3??4x4??5x5??6x6??7x7??
式中: ?0,?1,?3,?4,?5,?6,?7为未知参数,?为随机误差,且认为?服从
N(0,?2)的分布。对于式中未知参数的估计采用最小二乘法,求相关系数R2,并做显著性检验,通过二者表明模型建立的是正确的。
- 5 -
50001000015000
200003.2 模型的求解
为了确定商品房销售价格与各变量之间的关系,分别作出ym与xi的散点图, R语言的程序如下: plot(X)
得到散点图如下:
t250005000500015000250001000020000300001600200040080012002008yx13500010000x2x3380042001600x4x530001200400x6100x7199820022006201030000500007000038004000420015002500100105110
利用程序cor(X)得到相关矩阵并整理得:
y
t 0.9195056 y 1.0000000 x1 0.9533447 x2 0.9792964 x3 0.6385694 x4 0.9490735 x5 -0.3246709 x6 0.9005302 x7 -0.1598100
并分别对ym与xi的相关性进行检验,检验的程序为
attach(X)
下列对象被屏蔽了from X (position 3): t, x1, x2, x3, x4, x5, x6, x7, ym
cor.test(ym,x1) cor.test(ym,x2) cor.test(ym,x3) cor.test(ym,x4) cor.test(ym,x5) cor.test(ym,x6) cor.test(ym,x7)
- 6 -
1500300001998得到如下的七个结果:
- 7 -
综合以上的结果,可知,在??0.05的条件下,x5和x7的与ym的相关性较差,其他五个变量与ym的相关性较好,故进行多元线性回归时,可考虑将x5和x7两个因素排除在外。
首先对七个变量建立多元回归方程的R语言程序为: reg1=lm(ym~x1+x2+x3+x4+x5+x6+x7) summary(reg1) 得到如下结果:
- 8 -
共分享92篇相关文档