当前位置:首页 > 2020高中数学 第1章 统计案例 1.2 回归分析学案 苏教版选修1-2
2020
1.2 回归分析
1.线性回归模型
(1)线性回归模型y=a+bx+ε,其中a+bx是确定性函数,ε称为随机误差. (2)随机误差产生的原因主要有以下几种: ①所用的确定性函数不恰当引起误差; ②忽略了某种因素的影响; ③存在观测误差.
^^^
(3)在线性回归方程y=a+bx中
-
? xi-x^
i=1n-yi-y=
--
?xiyi-nxyi=1
nb=
-
? xi-xi=1n2
,
-xi-n?x2
n2
i=1
nn-^--1-1
a=y-bx(其中x=?xi,y=?yi).
^
ni=1ni=1
^^^^^
其中,a,b分别为a,b的估计值,a称为回归截距,b称为回归系数,y称为回归值. 2.相关系数
(1)计算两个随机变量间线性相关系数的公式
-
? xi-xi=1n2
-
? yi-yi=1
n2
--
?xiyi-nxyi=1
n=
n2
?xi-nxi=1
-
2
-yi-n?y2
i=1
n2
(2)r具有如下性质: ①|r|≤1;
2020
②|r|越接近于1,x,y的线性相关程度越强; ③|r|越接近于0,x,y的线性相关程度越弱. 3.对相关系数进行显著性检验的基本步骤
(1)提出统计假设H0:变量x,y不具有线性相关关系;
(2)如果以95%的把握作出判断,那么可以根据1-0.95=0.05与n-2在教材附录1中查出一个r的临界值
r0.05(其中1-0.95=0.05称为检验水平);
(3)计算样本相关系数r;
(4)作出统计推断:若|r|>r0.05,则否定H0,表明有95%的把握认为x与y之间具有线性相关关系;若|r|≤r0.05,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为y与x之间有线性相关关系.
我们把相关关系(不确定性关系)转化为函数关系(确定性关系),当两个具有相关关系的变量近似地满足一次^^^
函数关系时,我们所求出的函数关系式y=a+bx就是回归直线方程.求回归直线方程的一般方法是借助于工作^^-^-^^^^
软件求出回归直线方程,也可以利用计算器计算出b,再由a=y-bx求出a,写出回归直线方程y=bx+a.计算时应注意:
n?xiyi-nx y^^(1)求b时,利用公式b=
i=1n2
--
n-1-1
,先求出x=(x1+x2+…+xn),y=(y1+y2+…+yn),?xiyi=x1y1
?xi-nxi=1
n-
nn2
i=1
^-^-^2222
+x2y2+…+xnyn,?xi=x1+x2+…+xn.再由a=y-bx求出a的值,并写出回归直线方程.
i=1
^^
(2)线性回归方程中的截距a和斜率b都是通过样本估计而来的,存在着误差,这种误差可能导致估计结果的偏差.
^^^^^^^^
(3)回归直线方程y=a+bx中的b表示x增加1个单位时,y的变化量为b,而a表示y不随x的变化而变化的部分.
^^^
(4)可以利用回归直线方程y=a+bx求在x取某一个值时y的估计值.
2020
[例1] 假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计资料:
x y
2 2.2 3 3.8 4 5.5 5 6.5 6 7.0 若由数据可知,y对x呈线性相关关系. (1)求线性回归方程;
(2)估计使用年限为10年时,维修费用是多少?
^^
[思路点拨] 由于题目条件已经指明y对x呈线性相关关系,所以可直接利用公式求a与b,然后求出线性回归方程,最后把10代入,估计维修费用.
[精解详析] (1)列表如下:
i xi yi xiyi x2i
1 2 2.2 4.4 4 2 3 3.8 11.4 9 3 4 5.5 22.0 16 4 5 6.5 32.5 25 5 6 7.0 42.0 36 --2
经计算得:x=4,y=5,?xi=90,?xiyi=112.3,
i=1
i=1
55
--
?xiyi-5xy^于是b=
i=1
5
^-^-
=1.23,a=y-b·x=0.08,
5
2
i-5x?x2
-
i=1
^^^
所以线性回归方程为y=bx+a=1.23x+0.08.
^
(2)当x=10时,y=1.23×10+0.08=12.38(万元),即若估计使用年限为10年时,维修费用为12.38万元. [一点通] 若题目中没有指明y对x呈线性相关关系,而只给出资料,则需根据散点图或利用线性相关系数先确定变量是否线性相关,再求线性回归方程.
1.(辽宁高考)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收^
入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
^^
解析:以x+1代x,得y=0.254(x+1)+0.321,与y=0.254x+0.321相减可得,年饮食支出平均增加0.254
2020
万元.
答案:0.254
2.(湖北高考改编)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
^
①y与x负相关且y=2.347x-6.423; ^
②y与x负相关且y=-3.476x+5.648; ^
③y与x正相关且y=5.437x+8.493; ^
④y与x正相关且y=-4.326x-4.578. 其中一定不正确的结论的序号是________.
^^^^^
解析:由回归直线方程y=bx+a,知当b>0时,x与y正相关,当b<0时,x与y负相关,所以①④一定错误.
答案:①④
3.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元) 销售额y(万元) 4 49 2 26 3 39 5 54 ^^^^
根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时的销售额为________万元. -4+2+3+57-49+26+39+54解析:∵x==,y==42.
424^^^--
又y=bx+a必过(x,y), 7^^
∴42=×9.4+a,∴a=9.1.
2^
∴线性回归方程为y=9.4x+9.1.
^
∴当x=6时,y=9.4×6+9.1=65.5(万元). 答案:65.5
4.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元) 销量y(件) 8 90 8.2 84 8.4 83 8.6 80 8.8 75 9 68 ^--
(1)求回归直线方程y=bx+a,其中b=-20,a=y-bx;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最
共分享92篇相关文档