当前位置:首页 > 多元线性回归模型
第三章 多元线性回归模型
基本概念
(1)多元线性回归模型; (2)偏回归系数;
(3)正规方程组; (4)调整的多元可决系数; (5)多重共线性; (6)假设检验; 练习题
1. 多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有效性
的过程中,哪些基本假设起了作用?
2.在多元线性回归分析中,t检验与F检验有何不同?在一元线性回归分析中二者是否有等价的作用?
3.为什么说对模型参数施加约束条件后,其回归的残差平方和一定不比未施加约束的残差平方和小?在什么样的条件下,受约束回归与无约束回归的结果相同?
X1X2X34.在一项调查大学生一学期平均成绩(Y)与每周在学习(与其他各种活动(
X4)、睡觉()、 娱乐()
)所用时间的关系的研究中,建立如下回归模型:
Y??0??1X1??2X2??3X3??4X4?u
如果这些活动所用时间的总和为一周的总小时数168。问:保持其他变量不变,而改变其中一个变量的说法是否有意义?该模型是否有违背基本假设的情况? 如何修改此模型以使其更加合理?
5.表3-1给出三变量模型的回归结果。 表 3-1
方差来源 来自回归(ESS) 来自残差(RSS) 来自总离差(TSS) 平方和(SS) 自由度(d.f.) 平方和的均值(MSS) 65965 - - - - - 66042 14 (1)求样本容量n,残差平方和RSS,回归平方和ESS及残差平方和RSS的自由度。
(2)求拟合优度R及调整的拟合优度R。
(3)检验假设:X2和X3对Y无影响。应采用什么假设检验?为什么? (4)根据以上信息,你能否确定X3和X3各自对Y的影响?
6.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为 Y?10.36?0.094X1?0.131X2?0.210X3
R?0.214
22?2其中,Y为劳动力受教育年数,X1为该劳动力家庭中兄弟姐妹的人数,X2与X3分别为母亲与父亲受教育的年数。问: (1)
X1X2X3是否具有预期的影响?为什么?若
X1与保持不变,为了使预测的受教育水平减少
一年,需要
X2增加多少?
(2)请对的系数给予适当的解释。
(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个的父母受教育的年数为16年,则两人受教育的年数预期相差多少?
X17.以企业研发支出(R&D)占销售额的比重为被解释变量Y,以企业销售额额的比重
X2与利润占销售
为解释变量,一个容量为32的样本企业的估计结果如下:
Y?0.472?0.32logX1?0.05X2
(1.37) (0.22) (0.046) R?0.099 其中括号中为系数估计值的标准差。
logX12(1) 解释的系数。如果
X1增加10%,估计Y会变化多少个百分点?这在经济上是一
个很大的影响吗?
X1(2)针对R&D强度随销售额的增加而提高这一备择假设,检验它不随在5%和10%的显著性水平上进行这个检验。
而变化的假设。分别
(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响?
8.表3—2为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值(括号内为p-值,即以对应的t统计量为临界值的置信度?)(如果某项为空,则意味着模型中没有此变量)。数据为美国40个城市的数据。模型如下:
Y??0??1X1??2X2??3X3??4X4??5X5??6X6??7X7?u
其中,Y为实际颁发的建筑许可证数量,X1为每平方英里(1平方英里=2.59平方千米)的人口密度,X2为自有房屋的均值(单位:百美元),X3为平均家庭的收入(单位:千美元),
X4为1980----1992年的人口增长百分比,X5为失业率,X6为人均交纳的地方税,X7为
人均缴纳的州税。
表 3-2
变量 Y 模型A 模型B 模型C 模型D 813(0.74) —392(0.81) —1279(0.34) —973(0.44) 0.075(0.43) 0.062(0.32) 0.042(0.47) X1X2X3X4X5X6X7 —76.55(0.48) —0.855(0.13) —0.873(0.11) —0.994(0.O6) —0.778(0.07) 110.4l(0.14) 133.03(0.04) 125.71(0.05) 116.60(0.06) 26.77(0.11) 29.19(0.06) 29.41(0.001) 24.86(0.08) —0.061(0.95) —1.006(0.40) —1.004(0.37) RSS 4.763X107 4.843x107 4.962x107 5.038x107 0.349 0.338 0.322 0.312、 1.488x106 1.424x106 1.418x106 1.399x106 1.776x10 1.634x10 1.593x10 1.538x10
R ?2? AIC
26666(1)检验模型A中的每一个回归系数在10%水平下是否为零(括号中的值为p-值)。根据检验结果,你认为应该把变量保留在模型中还是去掉?
(2)在模型A中,在10%水平下检验联合假设片
H0:?i?0?i?1,?,6,7?。说明被择假设,
计算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明你的结论。 (3)哪个模型是“最优的”?解释你的选择标准。
(4)说明最优模型中有哪些系数的符号是“错误的”。说明你的预期符号并解释原因。确认其是否为正确符号。
9. 在经典线性模型基本假定下,对含有三个自变量的多元回归模型 Y??0??1X1??2X2??3X3?u 你想检验的虚拟假设是H0:?1?2?2?1。
???Var??1?2?2?1?2? (1)用,的方差及其协方差求出
?????。
(2)写出检验
H0:?1?2?2?1的t统计量。
?0 (3)如果定义
??1?2?2??,写出一个涉及
,?,
?2和
?3的回归方程,以便能直接
得到?估计值?及其标准误。
X1X210. 对于涉及到三个变量Y,,,的数据做以下回归:
(1)
Y??0??1X1i?u1iY??0??1X2i?u2i
(2)
(3)
Y??0??1X1i??2X2i?u3i????
问在什么条件下才能有相同。
?1??1及
?1??2,即多元回归与各自的一元回归所得的参数估计值
11. 对多元线性回归模型Y?X???,试证明随机干扰项?的方差的无偏估计量为
??2?een?k?1。其中e为相应样本回归模型的残差向量。
'
共分享92篇相关文档