当前位置:首页 > 第十章直线相关与回归
第十章 直线相关与回归
一、教学大纲要求
(一) 掌握内容
⒈ 直线相关与回归的基本概念。 ⒉ 相关系数与回归系数的意义及计算。 ⒊ 相关系数与回归系数相互的区别与联系。 (二)熟悉内容
⒈ 相关系数与回归系数的假设检验。 ⒉ 直线回归方程的应用。 ⒊ 秩相关与秩回归的意义。 (三)了解内容 曲线直线化。
二、 学内容精要
(一) 直线回归 1. 基本概念
直线回归(linear regression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simple regression)。
??a?bX中,a、b是决定直线的两个系数,见表10-1。 直线回归方程Y
表10-1 直线回归方程a、b两系数对比
a b 含义 回归直线在Y轴上的截距(intercept)。 回归系数(regression coefficient),即直线
表示X为零时,Y的平均水平的估计的斜率。表示X每变化一个单位时,Y的值。 平均变化量的估计值。
系数>0 a>0表示直线与纵轴的交点在原点的b>0,表示直线从左下方走向右上方,即Y
上方 随X增大而增大
系数<0 a<0表示直线与纵轴的交点在原点的b<0,表示直线从左上方走向右下方,即Y
下方 随X增大而减小
系数=0 a=0表示回归直线通过原点 b=0,表示直线与X轴平行,即Y不随X
的变化而变化
计算公式 ?(X?X)(Y?Y)?lXY
b?a?Y?bX (X?X)2lXX?
2. 样本回归系数b的假设检验 (1)方差分析; (2)t检验。
85
3. 直线回归方程的应用 (1)描述两变量的依存关系; (2)用回归方程进行预测; (3)用回归方程进行统计控制; (4)用直线回归应注意的问题。 (二) 直线相关 1. 基本概念
直线相关(linear correlation)又称简单相关(simple correlation),用于双变量正态分布资料。有正相关、负相关和零相关等关系。直线相关的性质可由散点图直观的说明。
相关系数又称积差相关系数(coefficient of product-moment correlation),以符号r表示样 本相关系数,ρ表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。
2.
计算公式
r??(X?X)(Y?Y)?(X?X)(Y?Y)2?2lXYlXXlYY
相关系数r没有单位,其值为-1≤r≤1。其绝对值愈接近1,两个变量间的直线相关愈密切;愈接近0,相关愈不密切。r值为正表示正相关,说明一变量随另一变量增减而增减,方向相同;r值为负表示负相关,说明一变量增加、另一变量减少,即方向相反;r的绝对值等于1为完全相关。
3. 样本相关系数r的假设检验 (1)r界值表法; (2)t检验法。
(三)直线回归与相关的区别与联系 1. 区别
(1) 资料要求:直线回归要求因变量Y服从正态分布,X是可以精确测量和严格控制的变量,一般称为Ⅰ型回归;直线相关要求两个变量X、Y服从双变量正态分布。这种资料若进行回归分析称为Ⅱ型回归。
(2) 应用情况:直线回归是说明两变量依存变化的数量关系;直线相关是说明两变量间的相关关系。
(3) 意义:b表示X每增(减)一个单位时,Y平均改变b个单位;r说明具有直线关系的两个变量间关系的密切程度与相关方向。
(4) 计算:b= lxy/ lxx ;r = lxy/lxxlyy。 (5) 取值范围:—∞<b<+∞ ;-1≤r≤1 。 (6) 单位:b有单位;r没有单位。 2. 联系
(1) 方向一致:对一组数据若能同时计算b和r,它们的符号一致。
(2) 假设检验等价:对同一样本,r和b的假设检验得到的t值相等,即tb=tr 。
86
(3) 用回归解释相关:决定系数r?则r2越接近1,说明引入相关的效果越好。 (四)秩相关
22lxylxxlyy?SS回SS总,回归平方和越接近总平方和,
秩相关,又称等级相关(rank correlation),是用双变量等级数据作直线相关分析,适用于下列资料:
⒈ 不服从双变量正态分布而不宜作积差相关分析; ⒉ 总体分布型未知; ⒊ 用等级表示的原始数据。
三、典型试题分析
1.回归系数的假设检验( )
A.只能用r的检验代替 B.只能用t检验 C.只能用F检验 D.三者均可 答案:D
[评析] 本题考点:回归系数假设检验方法的理解。
回归系数的假设检验常用的方法有:①方差分析;②t检验。对同一样本,r和b的假设检验等价,r和b的假设检验得到的t值相等,即tb=tr。故回归系数的假设检验用三者均可。
2.已知r1=r2,那么( )
A.b1=b2 B.tb1=tb2
C.tr1=tr2 D.两样本决定系数相等 答案: D
[评析] 本题考点:直线相关系数与回归系数关系的理解。
因为相关系数r和回归系数b的计算公式不同,不能推导出b1=b2 ;r和b的假设检验等价,即tr1= tb1,tr2=tb2,而不是tb1=tb2,tr1=tr2 ;样本决定系数为r2,已知r1=r2,则两样本决定系数相等,即r1=r2。
3.|r|>r0.05( n-2)时,可认为两变量X与Y间( )
A.有一定关系 B. 有正相关关系 C.一定有直线关系 D. 有直线关系 答案: D
[评析] 本题考点:直线相关系数假设检验的理解。
因为直线相关系数r是样本的相关系数,它是相应总体相关系数ρ的估计值。由于抽样误差的影响,必须进行显著性检验。r的假设检验是检验两变量是否有直线相关关系。|r|>r0.05( n-2)时,P<0.05,拒绝H0,接受H1,认为总体相关系数ρ≠0,因此可认为两变量X与Y间有直线关系。
4.相关系数检验的无效假设H0是( )
A.ρ=0 B. ρ≠0 C.ρ>0 D. ρ<0 答案: A
87
2
2
[评析] 本题考点:直线相关系数显著性检验中检验假设的理解。
因为r是样本相关系数,它是总体相关系数ρ的估计值。要判两变量间是否有相关关系,就要检验r是否来自总体相关系数ρ为零的总体。因为即使从ρ=0的总体作随机抽样,由于抽样误差的影响,所得r值也常不等于零。
5.同一双变量资料,进行直线相关与回归分析,有( )。
A.r>0,b<0 B. r>0,b>0
C.r<0,b>0 D. r与b的符号毫无关系 答案: B
[评析] 本题考点:直线相关与回归的区别与联系的理解。
因为对同一资料而言直线相关系数与回归系数的方向一致,若能同时计算b和r,它们的符号一致。因此,同一双变量资料,进行直线相关与回归分析,有r>0,b>0。
四、习 题
(一) 单项选择题 1.
下列( )式可出现负值。
A.∑(X—X)2 B.∑Y 2—(∑Y)2/n C.∑(Y—Y) 2 D.∑(X—X)(Y—Y) 2.
Y=14+4X是1~7岁儿童以年龄(岁)估计体重(市斤)的回归方程,若体重换成国际单位kg,则此方程( )。
A.截距改变 B.回归系数改变 C.两者都改变 D.两者都不改变
3.
已知r=1,则一定有( )。
A.b=1 B.a=1 C.SY. X=0 D.SY. X= SY
4.
用最小二乘法确定直线回归方程的原则是各观察点( )。 A.距直线的纵向距离相等 B.距直线的纵向距离的平方和最小 C.与直线的垂直距离相等 D.与直线的垂直距离的平方和最小
5.
直线回归分析中,X的影响被扣除后,Y方面的变异可用指标( )表示。 A.Sx,y?C. Sy,x6.
2X)?(X???)2(n?1) (n?2) B. Sr??(Y?YX?X???)2(n?2) D. S?S??(Y?Ybxy??2 7.
直线回归系数假设检验,其自由度为( )。
A.n B.n-1 C.n-2 D.2n-1 应变量Y的离均差平方和划分,可出现( )。
88
共分享92篇相关文档