当前位置:首页 > 高中数学选修2-3人教A教案导学案3.1.1回归分析的基本思想及其初步应用
.
流速y(m/s) 1.70 1.79 1.88 1.95 2.03 2.10 2.16 2.21 (1) 求y与x的回归直线方程; (2) 预测水深为1.95m时水的流速是多少?
分析:(1)y与x的回归直线方程为y?0.733x?0.6948 (2)当水深为1.95m时,可以预测水的流速约为2.12m/s 五、当堂练习
(x1,y1),(x2,y2),(x3,y3),1.对两个变量y和x进行回归分析,得到一组样本数据:
则下列说法不正确的是( )
A.由样本数据得到的回归方程y?bx?a必过样本中心(x,y) B.残差平方和越小的模型,拟合的效果越好
C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
,(xn,yn).D.若变量y与x之间的相关系数r??0.9362,则变量y与x之间具有线性相关关系
2.已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜年平均产量yt之间的关系有如下数据: 年份 x(kg) y(t) 年份 x(kg) y(t) 1985 70 5.1 1993 92 11.5 1986 74 6.0 1987 80 6.8 1994 108 11.0 1988 78 7.8 1995 115 11.8 1989 85 9.0 1996 123 12.2 1990 92 10.2 1997 130 12.5 1991 90 10.0 1998 138 12.8 1992 95 12.0 1999 145 13.0 若x与y之间线性相关,求蔬菜年平均产量y与使用氮肥量x之间的回归直线方程,并估计每单位面积蔬菜的年平均产量.(已知x?101,y?10.11,?xi?1152i?161,?xiyi?16076.8)
i?115解:设所求的回归直线方程为y?bx?a,则
?b??xy?15xyiii?11515?xi2?15xi?12?16076.8?15?101?10.11?0.0937,a?y?bx?10.11?0.0937?101?0.6463.2161125?15?101所以,回归直线方程为:y?0.0937x?0.6463精品
.
当x=150kg时,每单位面积蔬菜的年平均产量y?0.0937?150?0.6463?14.701(kg)
课后练习与提高
1、 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生
产能耗y(吨标准煤)的几组对照数据: x y 3 2.5 4 3 5 4 6 4.5 (1) 请画出上表数据的散点图; (2) 请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y?bx?a; (3) 已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归
方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3?2.5?4?3?5?4?6?4.5?66.5) 解:(1)由题设所给数据,可得散点图如下图 (2)由对照数据,计算得:
43?4?5?62.5?3?4?4.5xi?86,x??4.5,y??3.5,已知?xiyi?66.5 ?44i?1i?124所以,由最小二乘法确定的回归方程的系数为:
b??xy?4xiii?144y2??xi?12i?4x66.5?4?4.5?3.5?0.7,a?y?bx?3.5?0.7?4.5?0.35.
86?4?4.52 因此,所求的线性回归方程为y?0.7x?0.35
(4) 由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为 。 90?(0.7?100?0.35)?19.65(吨标准煤)
精品
.
3.1.2 回归分析的基本思想及其初步应用回归分析的基本思想及其初步应用 【教学目标】1.了解相关系数r;2 了解随机误差;3 会简单应用残差分析 【教学重难点】
教学重点:相关系数和随机误差 教学难点:残差分析应用。 【教学过程】
一、设置情境,引入课题
上节例题中,身高172cm女大学生,体重一定是60kg吗?如果不是,其原因是什么? 二、引导探究,发现问题,解决问题
1 y?0.849x?85.712对于b?0.849是斜率的估计值,说明身高x每增加1个单位,体重就 ,表明体重与身高具有 的线性相关关系。 2 如何描述线性相关关系的强弱?
r??(x?x)(y?y)iii?1n?(x?x)?(y?y)2iii?1i?1nn
2(1)r>0表明两个变量正相关;(2)r<0表明两个变量负相关;
(3)r的绝对值越接近1,表明相关性越强,r的绝对值越接近0,表明相关性越弱。 (4)当r的绝对值大于0.75认为两个变量具有很强的相关性关系。
3 身高172cm的女大学生显然不一定体重是60.316kg,但一般可以认为她的体重接近于60.316kg.
①样本点与回归直线的 ②所有的样本点不共线,而是散布在某一条直线的附近,该直线表示身高与体重的关系的线性回归模型表示y?bx?a??
e是y与y?bx?a的误差,e为随机变量,e称为随机误差。 ③E(e)=0,D(e)= ?>0.④D(e)越小,预报真实值y的精度越高。 ⑤随机误差是引起预报值y与真实值y之间的误差之一。
⑥a,b为截距和斜率的估计值,与a,b的真实值之间存在误差,这种误差也引起y与真实值y之间的误差之一。 4 思考
产生随机误差项e的原因是什么?
5 探究在线性回归模型中,e是用y预报真实值y的误差,它是一个不可观测的量,那么应该怎样研究随机误差?如何衡量预报的精度?
①D(e)??来衡量随机误差的大小。②ei?yi?yi ③ei?yi?yi?yi?bxi?a22
精品
.
1n21e?Q(a,b)(n?2) ④???n?2i?1n?22⑤Q(a,b)称为残差平方和,?越小,预报精度越高。
6 思考
当样本容量为1或2时,残差平方和是多少?用这样的样本建立的线性回归方程的预报误差为0吗? 7 残差分析
2①判断原始数据中是否存在可疑数据;②残差图 ③相关指数R?1?2?(y?y)iin2?(y?y)ii?1i?1n
2④R2越大,残差平方和越小,拟合效果越好;R2越接近1,表明回归的效果越好。 8 建立回归模型的基本步骤:
①确定研究对象,明确哪个变量时解释变量,哪个变量时预报变量。 ②画出确定好的解释变量和预报变量得散点图,观察它们之间的关系; ③由经验确定回归方程的类型;
④按一定规则估计回归方程中的参数; ⑤得出结果后分析残差图是否异常。 三、典型例题
例1 下表是某年美国旧轿车价格的调查资料,今以x表示轿车的使用年数,y表示响应的年均价格,求y关于x的回归方程 使用1 年数x 年均2651 价格y(美元) 2 1943 3 1494 4 1087 5 765 6 538 7 484 8 290 9 226 10 204 分析:由已知表格先画出散点图,可以看出随着使用年数的增加,轿车的平均价格在递减,但不在一条直线附近,但据此认为y与x之间具有线性回归关系是不科学的,要根据图的形状进行合理转化,转化成线性关系的变量间的关系。 解:作出散点图如下图
可以发现,各点并不是基本处于一条直线附近,因此,y与x之间应是非线性相关关系.与已学函数图像比较,用y?ebx?a来刻画题中模型更为合理,令z?lny,则z?bx?a, 题中数据变成如下表所示: x y 1 7.883 2 7.572 3 7.309 4 6.991 5 6.640 6 6.288 7 6.182 8 5.670 9 5.421 10 5.318 在散点图中可以看出变换的样本点分布在一条直线附近,因此可以用线性回归模型方程拟合,由表中数据可得
精品
共分享92篇相关文档