当前位置:首页 > 计量第二次作业
第三章
1.观察下列方程并判断其变量是否呈线性?系数是否呈线性?或都是?或都不是?
1) Yi??0??1Xi3??i 2) Yi??0??1logXi??i 3) logYi??0??1logXi??i 4) Yi??0??1(?2Xi)??i 5) Yi??0??i ?1Xi6) Yi?1??0(1?Xi?1)??i 7)Yi??0??1X1i??2X2i10??i
解:(1)(2)(3)(7)变量非线性,系数线性。(4)变量线性,系数非线性。(5)(6)变量和系数均为非线性。
2.多元线性回归模型与一元线性回归模型有哪些区别?
解:一元线性是说一个解释变量对被解释变量的影响。多元线性则是多个解释变量对被解释变量的影响。多元线性回归模型与一元线性回归模型的区别表现在如下几个方面:一是解释变量的个数不同;二是模型的经典假设不同,多元线性回归模型比一元线性回归模型多了个“解释变量之间不存在线性相关关系”的假定;三是多元线性回归模型的参数估计式的表达更为复杂。计算一元线性回归方程的最小二乘法是整个回归思想中的核心。在多元线性回归方程中,由于变量的增多,最普遍的会出现异方差性,还会有时序性等影响着回归方程的拟合度。 3.为什么说最小二乘估计量是最优的线性无偏估计量?多元线性回归最小二乘估计的正规方程组,能解出唯一的参数估计的条件是什么?
解:在满足经典假设的条件下,参数的最小二乘估计量具有线性性、无偏性以及最小性方差,所以被称为最优线性无偏估计量(BLUE)。对于多元线性回归最小二乘估计的正规方程组,能解出唯一的参数估计量的条件是解释变量间不完全线性相关。
4.多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有效性的过程中,哪些基本假设起了作用? 解:随机误差项零均值,同方差,无序列相关且服从正态分布。解释变量非随机,
如果是随机的,不能与随机误差项相关,解释变量之间不存在共线性。 5.在多元线性回归分析中,t检验与F检验有何不同?在一元线性回归分析中二者是否有等价的作用?
解:t检验是检验各个参数的显著性,F检验是检验回归整体的显著性。F检验通过威逼t检验通过。但在一元回归模型中,二者是等价的,因为两者都是对共同的假设——解释变量参数等于0。
6.对模型yi??0??1x1i??2x2i????kxki?ui应用OLS法,得到回归方程如下:
????x???x?????x ?i??y011i22ikki?i?i?0 ?i与y?i不相关,即:?y要求:证明残差?i?yi?y
7.下表给出三变量模型的回归结果: 方差来源 平方和(SS) 自由度(d.f.) 65965 来自回归—
来自残差_— —
66042 14 总离差(TSS) 要求:(1)样本容量是多少?
解:n=14+1=15 (2)求RSS?
解:RSS=TSS-ESS=66042-65965=77 (3)ESS和RSS的自由度各是多少? 解:ESS自由度=k=3,RSS自由度=n-k-1=11 (4)求R2和R?
解:R2=ESS/TSS=0.9986,R=1-(1-R2)(n-1)/(n-k-1)=0.9982 (5)检验假设:X2和X3对Y无影响。你用什么假设检验?为什么?
解:F检验做整体判别
(6)根据以上信息,你能否确定X2和X3各自对Y的贡献吗?
解:不能,不知道回归参数具体值,只能判断联合起来的线性影响
8.下表为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值(括号内为p-值)(如果某项为空,则意味着模型中没有此变量)。数据
22平方和的均值— — 为美国40个城市的数据。模型如下:
housing??0??1density??2value??3income??4popchang
??5unemp??6localtax??7statetax??式中housing——实际颁发的建筑许可证数量,density——每平方英里的人口密度,value——自由房屋的均值(单位:百美元),income——平均家庭的收入(单位:千美元),popchang——1980~1992年的人口增长百分比,unemp——失业率,localtax——人均交纳的地方税,statetax——人均缴纳的州税 变量 模型A 模型B 模型C 模型D C 813 (0.74) -392 (0.81) -1279 (0.34) -973 (0.44) Density 0.075 (0.43) 0.062 (0.32) 0.042 (0.47) Value -0.855 (0.13) -0.873 (0.11) -0.994 (0.06) -0.778 (0.07) Income 110.41 (0.14) 133.03 (0.04) 125.71 (0.05) 116.60 (0.06) Popchang 26.77 (0.11) 29.19 (0.06) 29.41 (0.001) 24.86 (0.08) Unemp -76.55 (0.48) Localtax -0.061 (0.95) Statetax -1.006 (0.40) -1.004 (0.37) RSS 4.763e+7 4.843e+7 4.962e+7 5.038e+7 R2 0.349 0.338 0.322 0.312 1.488e+6 1.424e+6 1.418e+6 1.399e+6 ?2 ?AIC 1.776e+6 1.634e+6 1.593e+6 1.538e+6 (1) 检验模型A中的每一个回归系数在10%水平下是否为零(括号中的值为
双边备择p-值)。根据检验结果,你认为应该把变量保留在模型中还是去掉?
解:在10%的置信区间上,A的系数的P值都大于0.1,应该接受原假设,认为它们不显著不为0,可以去掉这些变量。
(2) 在模型A中,在10%水平下检验联合假设H0:?I =0(i=1,5,6,7)。说明
被择假设,计算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明你的结论。
解:检验统计量F= R2(n-k-1)/k(1- R2)=0.402,F(4,3)=4.19,所以接受零假设。 (3) 哪个模型是“最优的”?解释你的选择标准。 解;;模型C的P值较好,拟合的较好。
(4)说明最优模型中有哪些系数的符号是“错误的”。说明你的预期符号并解释原因。确认其是否为正确符号?
解:私人住房单位应与density,popchang成反比,它们的系数可能应该是负数。
9.以企业研发支出(R&D)占销售额的比重为被解释变量(Y),以企业销售额(X1)与利润占销售额的比重(X2)为解释变量,一个有32容量的样本企业的估计结果如下:
Y?0.472?0.32log(X1)?0.05X2(1.37)(0.22)(0.046)
R2?0.099其中括号中为系数估计值的标准差。
(1)解释log(X1)的系数。如果X1增加10%,估计Y会变化多少个百分点?这在经济上是一个很大的影响吗?
(2)针对R&D强度随销售额的增加而提高这一备择假设,检验它不随X1而变化的假设。分别在5%和10%的显著性水平上进行这个检验。
(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响? 解:(1)dy/dx1=0.32/x,如果X1增加10%,Y会增加0.032个百分点。这在经济上不是一个较大的影响。
(2)相应的t统计量的值为t=0.32/0.22=1.455。在5%的显著性水平下,自由度为32-3=29的t 分布的临界值为2.045,计算出的t值小于该临界值,所以不拒绝原假设。这意味着销售额对R&D强度的影响不显著。在10%的显著性水平下,t分布的临界值为1.699,计算的t 值小于该值,不拒绝原假设,意味着销售额对R&D强度的影响不显著。
(3)对X2,参数估计值的t统计值为0.05/0.46=1.087,它比10%显著性水平下的临界值还小,因此可以认为它对Y在统计上没有显著的影响。
10.在经典线性模型基本假定下,对含有三个自变量的多元回归模型:
Y??0??1X1??2X2??3X3??
你想检验的虚拟假设是H0:?1?2?2?1。
?,??的方差及其协方差求出Var(???2??)。 (1)用?1212 (2)写出检验H0:?1?2?2?1的t统计量。
(3)如果定义?1?2?2??,写出一个涉及?0、?、?2和?3的回归方程,以便能直接得到?估计值??及其标准误。
??2??)?Var(??)?4Cov(??,??)?4Var(??) 解:(1)Var(?121122??2???1?12??2??)为(???2??)的标准差。 (2)t?,其中se(?1212??2??)se(?12 (3)由?1?2?2??知?1???2?2,代入原模型得
Y??0?(??2?2)X1??2X2??3X3????0??X1??2(2X1?X2)??3X3??
共分享92篇相关文档