当前位置:首页 > 人教版2020高考数学二轮复习专题四概率与统计第1讲统计与统计案例练习
-1
解 (1)x=(9+7+3+1)=5,
4-
y=(0.5+3.5+6.5+9.5)=5,
4
14
∑xiyi=9×0.5+7×3.5+3×6.5+1×9.5=58,
i=1
4
∑xi=9+7+3+1=140.
i=1
^58-4×5×521^?-21?×5=41, ∴b==-,a=5-?20?2
140-4×5204??^2141∴y关于x的线性回归方程为y=-x+.
204
22222
(2)根据表3可知,该月30天中有3天每天亏损2 000元,有6天每天亏损1 000元,有12天每天收入2 000元,有6天每天收入6 000元,有3天每天收入8 000元. 1
估计小李洗车店2017年11月份每天的平均收入为×(-2 000×3-1 000×6+
302 000×12+6 000×6+8 000×3)=2 400(元). 探究提高 1.求回归直线方程的关键及实际应用 (1)关键:正确理解计算b,a的公式和准确地计算.
(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. 2.相关系数
(1)当r>0时,表明两个变量正相关;当r<0时,两变量负相关. (2)当|r|>0.75时,认为两个变量具有较强的线性相关.
【训练3】 (2016·全国Ⅲ卷)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
^
^
注:年份代码1~7分别对应年份2008~2014.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
9
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:
7
7
7
参考数据:∑yi=9.32,∑tiyi=40.17,i=1
i=1
n∑ (yi-y)=0.55,7≈2.646.
i=1
-
2
∑ (ti-t)(yi-y)
参考公式:相关系数r=
i=1n--
∑ (ti-t)∑ (yi-y)
i=1
i=1
^
^
^
-
n2
,
-
2
回归方程y=a+bt中斜率和截距的最小二乘估计公式分别为:
n∑ (ti-t)(yi-y)
--
b=
^
i=1
n∑ (ti-t)
i=1
-
,a=y-b t.
2
^-^-
解 (1)由折线图中数据和附注中参考数据得
-
7
t=4,∑ (ti-t)=28,
i=1
7
-
7
2
∑ (yi-y)=0.55.
i=17
-
2
∑ (ti-t)(yi-y)=∑tiyi-t∑yi=40.17-4×9.32=2.89, i=1
i=1
i=1
--7-
r≈
2.89
≈0.99.
2×2.646×0.55
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
7
∑ (ti-t)(yi-y)^9.322.89i=1
(2)由y=≈1.331及(1)得b==≈0.103, 7
-7282
∑ (ti-t)
-
--
i=1
a=y-b t≈1.331-0.103×4≈0.92.
所以y关于t的回归方程为y=0.92+0.10t.
将2016年对应的t=9代入回归方程得y=0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨. 热点四 独立性检验
10
^
^
^-^-
【例4】 (2018·全国Ⅲ卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如图所示的茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
第一种生产方式 第二种生产方式 超过m 不超过m (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
n(ad-bc)2附:K=,
(a+b)(c+d)(a+c)(b+d)
2
P(K2≥k0) k0 0.050 3.841 0.010 6.635 0.001 10.828 -
解 (1)第一种生产方式时间集中在区间[80,90],且平均工作时间x1=84. 第二种生产方式的时间集中在区间[70,80),且平均工作时间x2=74.7. ∴x1>x2,所以第一种生产方式完成任务的平均时间大于第二种, ∴第二种生产方式的效率更高. (2)由茎叶图数据得到m=80. 由此填写列联表如下:
-
-
-
第一种生产方式 第二种生产方式 总计 (3)根据(2)中的列联表计算.
超过m 15 5 20 不超过m 5 15 20 总计 20 20 40 11
2
n(ad-bc)240(15×15-5×5)
K===10>6.635,所以有99%的
(a+b)(c+d)(a+c)(b+d)20×20×20×202
把握认为两种生产方式的效率有差异. 探究提高 1.独立性检验的一般步骤 (1)根据样本数据制成2×2列联表;
n(ad-bc)22
(2)根据公式K=计算K的值;
(a+b)(c+d)(a+c)(b+d)
2
(3)查表比较K与临界值的大小关系,作统计判断.
2.K的观测值k越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.
【训练4】 微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商).为了调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,将男性、女性使用微信的时间分成5组:(0,2],(2,4],(4,6],(6,8],(8,10]分别加以统计,得到如图所示的频率分布直方图.
2
2
(1)根据女性频率分布直方图估计女性使用微信的平均时间;
(2)若每天玩微信超过4小时的用户列为“微信控”,否则称其为“非微信控”,请你根据已知条件完成2×2的列联表,并判断是否有90%的把握认为“微信控”与“性别有关”? 解 (1)女性平均使用微信的时间为:
0.16×1+0.24×3+0.28×5+0.2×7+0.12×9=4.76(小时). (2)由已知得:2(0.04+a+0.14+2×0.12)=1,解得a=0.08. 由题设条件得列联表
男性 女性 微信控 38 30 非微信控 12 20 总计 50 50 12
共分享92篇相关文档