当前位置:首页 > 高考大一轮总复习10.3变量间的相关关系、统计案例
的情况,具体数据如下表:
专业 性别 男 女 非统计专业 13 7 统计专业 10 20 [答案] 5%
[解析] 由K2≈4.844>3.841.故认为选修文理科与性别有关系出错的可能性约为5%. (2)[2017·江西九江模拟]某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在40分以下的学生后,共有男生300名,女生200名.现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生的成绩分为6组,得到如下所示的频数分布表. 分数段 男 女 [40, 50) 3 6 [50, 60) 9 4 [60, 70) 18 5 [70, 80) 15 10 [80, 90) 6 13 [90, 100] 9 2 为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K2的观测值k=50×?13×20-10×7?2
≈4.844.
23×27×20×30
因为k>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.
附表:
P(K2≥k0) k0 答案:5% 解析:∵k>3.841,查临界值表,得P(K2≥3.841)=0.05,故这种判断出错的可能性为5%.
0.050 3.841 0.010 6.635 0.001 10.828 ①估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果看,数学成绩与性别是否有关;
②规定80分以上为优分(含80分),请你根据已知条件作出2×2列联表,并判断是否有90%以上的把握认为“数学成绩与性别有关”.
男生
女生 总计 附表及公式: 理科 13 7 20 文科 10 20 30 总计 23 27 50 2
优分 非优分 总计 100 [典题3] (1)为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:
男 女 总计 已知P(K2≥3.841)≈0.05, P(K2≥5.024)≈0.025.
50×?13×20-10×7?2
根据表中数据,得到K=≈4.844,则认为选修文理科与性别有关系
23×27×20×30
2
P(K2≥k0) k0 n?ad-bc?2K=. ?a+b??c+d??a+c??b+d?
0.100 2.706 0.050 3.841 0.010 6.635 0.001 10.828 [解] ①x男=45×0.05+55×0.15+65×0.3+75×0.25+85×0.1+95×0.15=71.5, x女=45×0.15+55×0.1+65×0.125+75×0.25+85×0.325+95×0.05=71.5, 从男、女生各自的平均分来看,并不能判断数学成绩与性别有关.
②由频数分布表可知,在抽取的100名学生中,“男生组”中的优分有15人,“女生组”
出错的可能性约为________.
5
中的优分有15人,
据此可得2×2列联表如下:
男生 女生 总计 2
55百元的人数 认为价 优分 15 15 30 非优分 45 25 70 总计 60 40 100 格偏高者 赞成 定价者 总计 2
55百元的人数 100×?15×25-15×45?2可得K=≈1.79,
60×40×30×70
因为1.79<2.706,所以没有90%以上的把握认为“数学成绩与性别有关”. [点石成金] 1.独立性检验的关键是正确列出2×2列联表,并计算出K的值. 2.弄清判断两变量有关的把握性与犯错误概率的关系,根据题目要求作出正确的回答.
2
n?ad-bc?2附:K=.
?a+b??c+d??a+c??b+d?
P(K2≥k0) k0 解:(1)“赞成定价者”的月平均收入为 x1=
20×1+30×2+40×3+50×5+60×3+70×4
1+2+3+5+3+4
0.05 3.841 0.01 6.635 ≈50.56.
“认为价格偏高者”的月平均收入为 x2=
20×4+30×8+40×12+50×5+60×2+70×1
4+8+12+5+2+1
[2017·广西玉林、贵港联考]某市地铁即将于2015年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下;
月收入 (单位: 百元) 赞成定 价者人数 认为价 格偏高 者人数 (1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差距是多少(结果保留2位小数);
(2)由以上统计数据填写下面的2×2列联表分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.
[15, 25) [25, 35) [35, 45) [45, 55) [55, 65) [65, 75] =38.75,
∴“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x1-x2=50.56-38.75=11.81(百元).
1 2 3 5 3 4 (2)根据条件可得2×2列联表如下:
认为价格 偏高者 赞成 定价者 总计 月收入低于 55百元的人数 29 月收入不低于55 百元的人数 3 总计 4 8 12 5 2 1 32 11 40 7 10 18 50 月收入低于 月收入不低于 总计 6
50×?7×29-3×11?2
K=≈6.27<6.635,
10×40×18×32
2
x=y=
8.2+8.6+10.0+11.3+11.9
=10,
56.2+7.5+8.0+8.5+9.8
=8,
5
∴没有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.
^
∴ a=8-0.76×10=0.4,
^^^^
[方法技巧] 1.求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时^
应仔细谨慎,分层进行,避免因计算而产生错误.(注意线性回归方程中一次项系数为b,常数^
项为a,这与一次函数的习惯表示不同.)
2.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.
[易错防范] 1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.
2.独立性检验中统计量K2的观测值k的计算公式很复杂,在解题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结果出错.
真题演练集训
1.[2015·福建卷]为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元) 支出y(万元) 8.2 6.2 8.6 7.5 10.0 8.0 11.3 8.5 11.9 9.8 n
^
∴ 当x=15时,y=0.76×15+0.4=11.8(万元).
2.[2016·新课标全国卷Ⅲ]下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1-7分别对应年份2008-2014.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明; (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:参考数据:?yi=9.32,?tiyi=40.17,
i=1i=1
7
7
7?yi-
y?2=0.55,7≈2.646.
i=1
i=1
? ?ti-t??yi-y?
^^^
,回归方程y=bt+a中斜率和截距的
2ni=1
n
参考公式:相关系数r=
ni=1
? ?ti-t?? ?yi-y?2
^^^^^-^根据上表可得回归直线方程y=bx+a,其中b=0.76,a=y-b x.据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元 答案:B
解析:由题意知,
7
^
最小二乘估计公式分别为b=
i=1
? ?ti-t??yi-y?
? ?ti-t?2
n
^^,a=y-bt.
i=1
解:(1)由折线图中数据和附注中参考数据,得
t=4,? (ti-t)=28,
i=1
7
2
i=1
? ?yi-y?=0.55,
x y w 7
2
i=1? (xi 8i=1? (wi 8i=1? (xi- 8i=1? (wi- 82.89
? (ti-t)(yi-y)=?tiyi-t?yi=40.17-4×9.32=2.89,r≈0.55×2×2.646≈0.99. i=1i=1i=1
7
7
7
-x)2 46.6 563 6.8 289.8 -w)2 1.6 x)(yi-y) 1 469 w)(yi-y) 108.8 因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
9.32(2)由y=≈1.331及(1),得
7
18
表中wi=xi,w=? xi.
8i=1
(1)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
^b=
i=1
? ?ti-t??yi-y?
? ?ti-t?2
7
7
2.89=≈0.103, 28
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程.
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题: ①年宣传费x=49时,年销售量及年利润的预报值是多少? ②年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),?,(un,vn),其回归直线v=α+β u的斜率和截距
i=1
^^
a=y-bt≈1.331-0.103×4≈0.92. ^
所以,y关于t的回归方程为y=0.92+0.10t. 将2016年对应的t=9代入回归方程,得 ^
y=0.92+0.10×9=1.82.
所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.
3.[2015·新课标全国卷Ⅰ]某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,?,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
^
的最小二乘估计分别为β=
i=1
? ?ui-u??vi-v?
? ?ui-u?2
n
n
^^,α=v-βu.
i=1
解:(1)由散点图可以判断,y=c+dx适宜作为年销售量y关于年宣传费x的回归方程类型.
(2)令w=x,先建立y关于w的线性回归方程.
^由于d=
i=1
? ?wi-w??yi-y?
? ?wi-w?2
8
8
108.8==68, 1.6
i=1
^^
c=y-dw=563-68×6.8=100.6,
8
^
所以y关于w的线性回归方程为y=100.6+68w,
共分享92篇相关文档