当前位置:首页 > 2018-2019学年高中数学人教A版选修2-3检测:课时跟踪检测(十七) 回归分析的基本思想及其初步应用
课时跟踪检测(十七) 回归分析的基本思想及其初步应用
层级一 学业水平达标
1.在对两个变量x,y进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释; ②收集数据(xi,yi),i=1,2,…,n; ③求线性回归方程; ④求相关系数;
⑤根据所搜集的数据绘制散点图.
如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是( )
A.①②⑤③④ C.②④③①⑤
B.③②④⑤① D.②⑤④③①
解析:选D 对两个变量进行回归分析时,首先收集数据(xi,yi),i=1,2,…,n;根据所搜集的数据绘制散点图.观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序是②⑤④③①.
2.下列说法错误的是( )
A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高 D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好
解析:选B 由于线性相关系数|r|≤1,且当|r|越大,线性相关性越强,故r<0时,选项B不正确.
3.已知具有线性相关关系的变量x,y满足一组数据如下表所示.若y关于x的回归方^
程为y=3x-1.5,则m的值为( )
x y 0 -1 1 1 2 m 3 8 9
A.4 B. C.5 D.6
2
38+m?
解析:选A 由题意可知,样本点的中心?,一定在回归直线上,所以代入方程
4??2可得m=4.
4.下表提供了某厂节能降耗技术改造后在生产A产品中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对应数据,根据表格提供的数据,求出y关于x的线性回归方程
^
为y=0.7x+0.35,则下列结论错误的是( )
x y
3 2.5 4 t 5 4 6 4.5 A.产品的生产耗能与产量呈正相关 B.t的取值必定是3.15 C.回归直线一定过点(4.5,3.5)
D.A产品每多生产1吨,则相应的生产耗能约增加0.7吨
解析:选B 由线性回归方程可知A、D正确.由表格可求出x=4.5,代入回归方程得y=3.5,所以回归直线一定过样本点的中心(4.5,3.5),可知C正确.回归直线不一定过样本点,所以B错误.
5.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x/万元 销售额y/万元 4 49 2 26 3 39 5 54 ^^^^根据表格可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元 C.67.7万元
B.65.5万元 D.72.0万元
解析:选B 根据题中数据可得样本中心点是(3.5,42), ^^
则a=y-bx=42-9.4×3.5=9.1,
^^
所以回归直线方程是y=9.4x+9.1,把x=6代入得y=65.5. 6.以下是某地区的降雨量与年平均气温的一组数据: 年平均气温/℃ 年降雨量/mm
12.51 542 12.84 507 12.84 813 13.69 574 13.33 701 12.74 432 13.05 464 根据这组数据可以推断,该地区的降雨量与年平均气温________相关关系.(填“具有”或“不具有”)
解析:画出散点图,观察可知,降雨量与年平均气温没有相关关系.
答案:不具有
7.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)1
的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据
2的样本相关系数为________.
解析:根据样本相关系数的定义可知, 当所有样本点都在直线上时, 相关系数为1. 答案:1
8.已知高三某班学生每周用于物理学习的时间x(单位:小时)与物理成绩y(单位:分)之间有如下关系:
x y
24 92 15 79 23 97 19 89 16 64 11 47 20 83 16 68 17 71 13 59 若根据上表可得回归直线的斜率为3.53,则回归直线在y轴上的截距为________.(结果精确到0.1)
解析:由已知可得 x=y=
1
(24+15+23+19+16+11+20+16+17+13)=17.4, 10
1
(92+79+97+89+64+47+83+68+71+59)=74.9. 10
^^^^
设回归方程为y=3.53x+a,把(x,y)代入,得74.9=3.53×17.4+a,解得a≈13.5,则回归直线在y轴上的截距为13.5.
答案:13.5
9.某公司的生产部门调研发现,该公司第二,三季度的月用电量与月份线性相关,且数据统计如下:
月份 月用电量(千瓦时/月)
4 6 5 16 6 27 7 55 8 46 9 56 但核对电费报表时发现一组数据统计有误. (1)请指出哪组数据有误,并说明理由;
^^^
(2)在排除有误数据后,求月用电量与月份之间的回归方程y=bx+a,并预测统计有误那个月份的用电量.(结果精确到0.1)
解:(1)作散点图如图所示.因为用电量与月份之间线性相关,所以散点图的样本点分布在回归直线附近比较窄的带状区域内,而点(7,55)离其他点所在区域较远,故(7,55)这组数据有误.
(2)排除(7,55)这一组有误数据后,计算得 x=6.4,y=30.2.
^因为b=
i=1
?xiyi-5x y
≈9.98,
i=1
5
?x2i-5x
5
2
^^
a=y-bx≈-33.67,
^
所以回归方程为y=9.98x-33.67, ^
当x=7时,y≈36.2,
即7月份的用电量大约为36.2千瓦时. 10.关于x与y有以下数据:
x y 2 30 4 40 5 60 6 50 8 70 ^已知x与y线性相关,由最小二乘法得b=6.5, (1)求y与x的线性回归方程;
^
(2)现有第二个线性模型:y=7x+17,且R2=0.82.
若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由. ^^
解:(1)依题意设y与x的线性回归方程为y=6.5x+a. x=y=
2+4+5+6+8
=5,
5
30+40+60+50+70
=50,
5
^^
∵y=6.5x+a经过(x,y), ^^
∴50=6.5×5+a,∴a=17.5,
^
∴y与x的线性回归方程为y=6.5x+17.5.
^
(2)由(1)的线性模型得yi-yi与yi-y的关系如下表:
^yi-yi yi-y 5
-0.5 -20 -3.5 -10 10 10 -6.5 0 0.5 20 ^
所以? (yi-yi)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155.
i=1
共分享92篇相关文档