当前位置:首页 > 2015年高三文科复习 - 统计与统计案例:[考点3]变量的相关性、最小二乘法及统计案例(解析版)
^
y=0.5x+0.4.
(3)由(2)可知,当x=11时, ^
y=0.5x+0.4=0.5×11+0.4=5.9(万元). ∴可以估计第6名推销员的年推销金额为5.9万元. 题型3:独立性检验及其应用 【典型例题】
1.通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:
男 女 总计 40 20 60 走天桥 20 30 50 走斑马线 60 50 110 总计 22nad-bc110×40×30-20×20由K2=,算得K2=≈7.8.
60×50×60×50a+bc+da+cb+d
附表:
P(K2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 对照附表,得到的正确结论是( ) A.有99%以上的把握认为“选择过马路的方式与性别有关” B.有99%以上的把握认为“选择过马路的方式与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关”
110×40×30-20×2022
解析:选A ∵K=≈7.8>6.635,∴有99%以上的把握认为“选择过马路的方式与性别有关”.
60×50×60×50
2.在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效? 解 根据题目所给的数据作出如下的列联表:
色盲 不色盲 总计 38 442 480 男 6 514 520 女 44 956 1 000 总计 根据列联表作出相应的等高条形图,如图所示.
从等高条形图来看,男性患色盲的频率要高一些,因此直观上可以认为色盲与性别有关. 根据列联表中所给的数据可以有
a=38,b=442,c=6,d=514,a+b=480,c+d=520, a+c=44,b+d=956,n=1 000,
n(ad-bc)22
代入公式K=,
(a+b)(c+d)(a+c)(b+d)(38×514-6×442)221 000×得K=≈27.1. 480×520×44×956
由于K2=27.1>10.828,所以我们有99.9%的把握认为性别与患色盲有关. 这个结论只对所调查的480名男人和520名女人有效.
3. (2012·湖南联考)衡阳市第一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的2×2列联表,且已知在甲、乙两个文科班全部110人中
3
随机抽取1人为优秀的概率为. 11
5
甲班 乙班 合计 优秀 10 非优秀 30 合计 110 (1)请完成上面的列联表;
(2)根据列表中的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”;
nad-bc22
参考公式与临界值表:K=
a+bc+da+cb+dP(K2≥k0) 0.100 0.050 0.025 0.010 0.001 k0 2.706 3.841 5.024 6.635 10.828 [自主解答] (1)列联表如下: 优秀 非优秀 合计 10 50 60 甲班 20 30 50 乙班 30 80 110 合计
10×30-20×5022110×(2)根据列联表中的数据,得到K=≈7.486<10.828. 60×50×30×80
因此按99.9%的可靠性要求,不能认为“成绩与班级有关系”.
【变式训练】
1.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A.若K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病
B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病 C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误 D.以上三种说法都不正确
解析:选C 根据独立性检验的思想知.
2.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:
理科 文科 13 10 男 7 20 女
已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.
13×20-10×72250×根据表中数据,得到K=≈4.844.则认为选修文科与性别有关系出错的可能性为________. 23×27×20×30
解析:k≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%. 答案:5%
3.(2012辽宁改编)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性. (1)根据已知条件完成下面的2×2列联表,并据此资料判断是否有95%的把握认为“体育迷”与性别有关?
非体育迷 体育迷 合计 男
6
女 合计
(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.
nad-bc22
附K=,
a+bc+da+cb+d
P(K2≥k) 0.05 0.01 k 3.841 6.635
[准确规范答题]
(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而完成2×2列联表如下:
非体育迷 体育迷 合计 30 15 45 男 45 10 55 女 75 25 100 合计
30×10-45×1521002100×将2×2列联表中的数据代入公式计算,得K==≈3.030.因为3.030<3.841,所以我们没有75×25×45×5533
95%的把握认为“体育迷”与性别有关.
(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件为(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2),其中ai表示男性,i=1,2,3,bj表示女性,j=1,2.由10个基本事件组成,而且这些基本事件的出现是等可能的.用A表示“任选2人中,至少有1人是女性”这一事件,则A为(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2),?(11分)
7
由7个基本事件组成,因而P(A)=.
10
【高考真题综合训练】
1.[2014·重庆卷] 已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得的线性回归方程可能是( )
A.y^=0.4x+2.3 B.y^=2x-2.4
C.y^=-2x+9.5 D.y^=-0.3x+4.4
答案:A [解析] 因为变量x与y正相关,则在线性回归方程中,x的系数应大于零,排除B,D;将x=3,y=3.5分别代入A,B中的方程只有A满足,故选A. 2.[2014·泰安一模] 为了调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了500位老人,其结果如下表:
性别 是否需要 男 女 志愿者 40 30 需要 160 270 不需要 2n(ad-bc)由K2=,得
(a+b)(c+d)(a+c)(b+d)500×(40×270-30×160)22
K=≈9.967.
200×300×70×430
附表:
P(K2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828
7
参照附表,可得到的结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“需要志愿者提供帮助与性别有关” B.在犯错误的概率不超过0.1%的前提下,认为“需要志愿者提供帮助与性别无关” C.有99%以上的把握认为“需要志愿者提供帮助与性别有关” D.有99%以上的把握认为“需要志愿者提供帮助与性别无关” 答案:C [解析] 由数据知,选项C正确.
3.[2014·韶关一模] 设某大学的女生体重y(kg)与身高x(cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),
^
用最小二乘法建立的线性回归方程为y=0.85x-85.71,给出下列结论: ①y与x具有正的线性相关关系; ②回归直线过样本点的中心(x,y); ③若该大学某女生身高增加1 cm,则其体重约增加0.85 kg; ④若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg. 其中,正确结论的序号是______________. 答案:①②③ [解析] 利用有关概念可知,①②③正确. 4.[2014·湖北卷] 根据如下样本数据 x 3 4 5 6 7 8 y 4.0 2.5 0.5 -0.5 -2.0 -3.0 ^得到的回归方程为\\s\%up6(^(^)y=bx+a,则( ) A.a>0,b<0 B.a>0,b>0 C.a<0,b<0 D.a<0,b>0
答案:A [解析] 作出散点图如下:
^
由图像不难得出,回归直线\\s\%up6(^(^)y=bx+a的斜率b<0,截距a>0,所以a>0,b<0.故选A.
5.(2013年高考福建卷(文))某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关.现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,在将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.
(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的频率. (2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2?2的列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?
8
共分享92篇相关文档