当前位置:首页 > 对比研究时间序列模型,回归模型和灰色系统模型的预测能力
大连市住宅市场三年内需求预测
——对比研究时间序列模型,回归模型和灰色系统模型的预测能力
李长斌 王建军 刘海旺
(大连住宅产业化协会,辽宁,大连,116021)
摘要:
论文首先归纳了影响住宅市场需求的社会性和经济性因素,并通过灰色系统关联度法定量分析了这些因素对大连市住宅市场需求的影响程度,找出了关键性影响因素。然后,论文以大连市历年的住宅市场需求统计量为基础,对三种需求预测方法—博克思-詹金斯法、多元线性回归法和灰色系统模型法的预测准确性进行了实证分析和比较,最后应用预测能力最好的博克思-詹金斯法对大连市住宅市场短期需求量进行了科学的预测。
关键词:需求预测;灰色关联度;博克思-詹金斯法;灰色系统模型;岭回归,线性回归 中图分类号:TU98
0.引言
住宅行业作为大连市房地产行业的主体部分,其生产总值占到房地产业生产总值的60%,约占大连市国内生产总值的7.5%左右,它的发展直接影响到整个房地产行业的发展,从而对大连市的国民经济构成了较大的影响。所以,明确影响住宅需求的主要影响因素,采用合适的方法对大连市住宅市场需求进行准确预测,无论就政府对住宅市场发展进行短期控制和平衡,还是对于整个住宅产业的长期发展进行规划都极为重要。
1分析住宅市场需求主要影响因素
1.1一般性影响因素分析与选取
住宅市场需求影响因素包括经济性和社会性两类影响因素,具体可以归纳为17个因素。根据可量化性,统计资料的可获得性和完整性,论文确定了9个因素作为大连市住宅市场需求的一般性影响因素,各影响因素见表1。(历年统计数据见附录A)。
表1 住宅市场需求影响因素经济性因素 1、居民收入水平 2、居民消费水平 3、住房消费倾向 4、房价水平 5、利 率 6、经济发展速度和水平 7、恩格尔系数 8、土地价格 社会性因素 1、人口数量和人口结构 2、人口自然增长率 3、人口的机械变化率 4、城市家庭总户数 5、城市化水平 6、人均居住面积 7、观念和审美 8、住房政策 [1] 可以量化及统计的变量 1、GDP (X1) 2、人均住房支出 (X2) 3、市区人口总量 (X3) 4、职工平均工资 (X4) 5、住宅平均售价 (X5) 6、人均居住面积 (X6) 7、市场实际利率 (X7) 8、年末家庭总户数 (X8) 9、住房租金 9、人均可支配收入 (X9) 1.2主要影响因素的确定 论文采用灰色关联度法来寻找大连市住宅市场需求的主要影响因素。灰色关联度分析是灰色系统理论提出的一种系统分析的新方法,这种方法可以根据因素之间发展的态势来衡量因素相关关系,因此,对样本大小没有过多的要求,通过量化分析,能够揭示事物动态相关的特征与程度。
绝对关联度计算(过程略),计算结果如下:
GRC01=0.6262,GRC=0.5150,GRCgrcgrc02=0.6789,GRC=0.5002,GRCgrcgrc03=0.5829,GRC=0.5465,GRCgrcgrc04=0.5090,GRC=0.5157
grc05=0.5605,
GRC06070809相对关联度计算(过程略),计算结果如下:
grcgrc0106??0.6186,0.7307,
0207??0.5145,0.5654,
0308??0.5635,0.5942,
0409??0.6891,0.7237,
05?0.9479,
灰色综合关联度计算结果如下 ?01??07??????????0.6224,020.5967,030.5732,040.5991,050.7542,060.6228,?????0.5328,080.5703,090.6197
由上面的计算结果,可知综合关联度由大到小的排列顺序为: ?05﹥?06﹥?01﹥?09﹥?04﹥?02﹥?03﹥?08﹥?07
通过各影响因素的综合关联度值,可以看出,房价(X5)是影响大连市住宅需求的最主要因素;其次是人均居住面积(X6);而其又和GDP(X1)、人均可支配收入(X9)、职工平均工资(X4)、人均住房支出(X2)等经济性因素紧密相关;市区人口总量 (X3)、年末家庭总户数(X8)和市场实际利率(X7)对大连市住宅市场需求的影响不明显。
2 三种短期预测方法的选取
根据预测趋势外推、相关原理,把预测方法分为时间序列法和因果关系法,而这两类方法的常用和代表模型就是博克斯-詹金斯法(ARIMA或B-J法)和多元线性回归法。同时针对统计数据少、影响因素复杂的对象,非线性预测方法——灰色系统GM(1,1)模型也常在预测中被人们使用。论文选用以上三种预测方法,分别对大连市住宅市场短期(2年)需求进行预测,比较其预测能力。
3 三种短期需求预测方法准确性的实证分析
以1990—2001年的数据去训练模型,用2002、2003年的数据去验证各个模型的预测能力。
为了避免时间序列中小的“噪音”对数据分析的干扰,影响整体数据分析的质量和效果,应用SPSS软件对住宅需求时间序列进行了“滤波”处理,处理结果如图1:
万平方米5005000199019911992199319941995199619971998199920002001200220030原始数据滤波后数据
图1 滤波后数据与原始数据比较
3.1博克思-詹金斯法(B—J法)
(1)利用自相关系数识别时间数列的随机性、平稳性或周期性等数据特征 住宅需求量的时间序列共有12个观察值,自相关系数分布如图2。
Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob. 1 .537 .256 . *********.* 4.403 .036 2 .243 .244 . ????***** . 5.396 .067 3 .086 .231 . ?** . 5.533 .137 4 .009 .218 . * . 5.534 .237 5 -.025 .204 . * . 5.549 .353 6 -.048 .189 . * . 5.613 .468 7 -.095 .173 . ** . 5.918 .549 8 -.181 .154 . **** . 7.301 .505 9 -.296 .134 *.**** . 12.212 .202
10 -.389 .109 ****.*** . 24.899 .006
Plot Symbols: Autocorrelations * Two Standard Error Limits .s .
图2 住宅需求量序列自相关系数
从图2可以看出来,自回归系数在逐渐衰减后,超出了可置信区间,所以,该时间数列不是稳定型随机数列,不符合B—J方法的要求。所以,对该时间数列进行一次差分,其自相关系数分布如图3:
Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob. 1 .556 .264 . *********** 4.419 .036 2 .132 .251 . ?*** . 4.697 .096
3 -.153 .237 . *** . 5.116 .163 4 -.342 .221 . ******* . 7.504 .112 5 -.438 .205 *.******* . 12.077 .034 6 -.401 .187 *.****** . 16.687 .011 7 -.239 .167 . ***** . 18.731 .009 8 -.005 .145 . * . 18.732 .016 9 .191 .118 . ****. 21.346 .011
图3 一次差分后的住宅需求量序列自相关系数
从图3可以看出,除第一个自相关系数与零有显著性差异之外,其余所有自相关系数都落在置信区间之内,
与零无显著性差异,自相关系数呈逐渐递减态势,所以,我们可以判定,该时间序列是一个平稳随机序列,所以,该时间序列满足ARIMA模型。
(2)自回归—移动平均模型ARIMA(p,d,q)参数识别
一般通过对比自相关系数的变化趋势图和偏自相关系数的曲线图,可以判别p和q的取值。 一次差分后时间序列的偏自相关系数分布如图4:
Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1
1 .556 .302 . ***********. 2 -.256 .302 . ***** . 3 -.160 .302 . *** . 4 -.212 .302 . **** . 5 -.218 .302 . **** . 6 -.153 .302 . *** . 7 -.074 .302 . * .
8 .011 .302 . * . 9 .014 .302 . * .
图4 一次差分后的住宅需求量序列偏自相关系数
对比一次差分后的自相关系数分布图和偏自相关系数分布图,可以发现,自相关系数呈正弦曲线衰减,但偏自相关系数则成不规则衰减,所以,可以判定自应该采用自回归即AR模型,即q=0。
然后,分别取p=1,p=2,用SPSS软件分析,可以看出,P=2时,AR模型对该时间序列有很好的解释能力。
所以,
ARIMA(p,d,q)=ARIMA(2,1,0)
即 其中 所以
zt????1?zt?1?????2?zt?2????et zt?xt?xt?1
xt???1??1??2??xt?1?1??1??xt?2??2??1???2x3?et
----时间t时的估计误差 ? ----自回归系数
在这里 -2〈?〈 +2 (3)残差检验
通过分析预测值与实际观察值的差值(残差)的自相关系数,可以看出残差为随机分布,从而说明预测模型可以用于预测,见图5。
Auto- Stand.
Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob.
1 .293 .264 . ****** . 1.229 .268 2 -.372 .251 . ******* . 3.426 .180 3 -.336 .237 . ******* . 5.438 .142 4 .063 .221 . * . 5.519 .238 5 .311 .205 . ****** . 7.818 .167 6 .136 .187 . *** . 8.346 .214 7 -.293 .167 . ****** . 11.408 .122 8 -.404 .145 **.***** . 19.194 .014 9 -.055 .118 . * . 19.411 .022
?-----数列前t个观察值的平均值 et图5 残差自相关系数
3.2多元线性回归分析法
以住宅需求量为因变量,以GDP、职工平均工资、年人均住房支出、利率、市区总人口、总户数、人均住房面积、人均可支配收入、住宅平均价格、滞后一期的人均可支配收入和提前一期的住房平均售价十一个组为自变量,带入SPSS软件进行逐步回归法(stepwise)进行线性回归分析,有四个变量进入了方程。分析结果如表2。
表2 回归模型概述 Std. Error of the Model 1 在表
R .997(a) R Square .994 Adjusted R Square .992 Estimate 4.01064 a Predictors: (Constant), (t-1年)人均可支配收入, (t+1年)平均住宅售价, 市区总人口 2列出了本次回归过程中的R相关系数、R平方判定系数、调整的R
22平方判定系数及估计值的标准误差。由R值(0.997)、R值(0.994)及调整的R值(0.992)看.因变量与自变量存在较强的线性关系。(t-1年)人均可支配收入,
共分享92篇相关文档