当前位置:首页 > 高考数学试题汇编统计、统计案例
答案:D
2.(2011年陕西卷,理9)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图所示),以下结论中正确的是( )
(A)x和y的相关系数为直线l的斜率 (B)x和y的相关系数在0到1之间
(C)当n为偶数时,分布在l两侧的样本点的个数一定相同 (D)直线l过点(x,y)
解析:相关系数是表示两个变量是否具有线性相关关系的量,可正可负也可为0,它的绝对值越接近1两变量相关性越强.因此A、B错,线性回归直线两侧样本点个数不一定相同,故C错.回归直线恒过样本中心(x,y).选项D正确. 答案:D
3.(2011年江西卷,理6)变量X和Y对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( ) (A)r2 解析:对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0.所以有r2<0 4.(2011年山东卷,理7)某产品的广告费用x与销售额y的统计数据如下表: 广告费用x/万元 销售额y/万元 4 49 2 26 3 39 5 54 ?x+a?为9.4,据此模型预报广告费用为6万元时销售额为( ) ?=b?中的b根据上表可得回归方程y(A)63.6万元 (B)65.5万元 (C)67.7万元 (D)72.0万元 解析:线性回归直线过定点(x,y),y= 49?26?39?54?x得?=y-b=42, x=3.5,代入a4?=6×9.4+9.1=65.5(万元). ?=42-9.4×3.5=9.1,所以ya答案:B 5.(2011年辽宁卷,理14)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程: ?=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加 万元. y ?增加0.254,从而家庭年收入每增加1万元,年饮食支出平均增加解析:由回归直线方程可知,x每增加1,y0.254万元. 答案:0.254 6.(2011年广东卷,理13)某数学老师的身高为176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 cm. 父亲身高x 173 170 176 解析:儿子和父亲的身高可列表如下:(单位:cm) 儿子身高y 170 176 182 ?x,由表中数据可求得x=173, y=176, ?=a设回归直线方程为y?+b?=∴b??xi?13i?xyi?yi?????xi?13?x?2= 3?63???3?22?x=3, ?=y-b=1,a?=x+3. 故回归直线方程为y?=182+3=185. 当x=182时, y故预测他孙子的身高为185 cm. 答案:185 考点五 独立性检验 (2012年辽宁卷,理19)电视传媒公司为了解某地区某类体育节目的收视情况,随机抽取了100名观众进行调查.如图所示的是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图. 将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”. (1)根据已知条件完成下面的2×2列联表,据此资料,你是否认为“体育迷”与性别有关? 男 女 总计 非体育迷 体育迷 总计 10 55 (2)将上述调查得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中“体育迷”的人数为X.若每次抽取的结果是相互独立的,求X的分布列、期望E(X)和方差D(X). 附:χ= 2 n?n11n22?n12n21?n1?n2?n?1n?2k 2. 0.05 3.841 0.01 6.635 P(χ2≥k) 解:(1)由频率分布直方图可知在抽取的100人中,“体育迷”有25人,从而2×2列联表补充如下: 男 女 总计 非体育迷 30 45 75 2 体育迷 15 10 25 总计 45 55 100 将2×2列联表中的数据代入公式计算,得χ=因为3.030<3.841, 100?30?10?45?15?75?25?45?552= 100≈3.030. 33所以没有足够的把握认为“体育迷”与性别有关. (2)由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为 X P 11.由题意知X~B(3, ),从而X的分布列为: 440 1 2 3 2764 2764 964 164 所以E(X)=np=3× 13139=,D(X)=np(1-p)=3××=. 444416模拟试题 考点一 抽样方法 1.(2013北京市丰台区期末)某高中共有学生900人,其中高一年级240人,高二年级260人,为做某项调查,拟采用分层抽样法抽取容量为45的样本,则在高三年级抽取的人数是 . 解析:高三的人数为400, 所以在高三抽取的人数为答案:20 2.(2013青岛一中调研)某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,……,第十组46~50号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为 的学生. 解析:因为12=5×2+2,即第三组抽出的是第二个同学, 所以每一组都相应抽出第二个同学. 所以第8组中抽出的号码为5×7+2=37号. 答案:37 45×400=20. 900 考点二 统计图表 1.(2013云南师大附中检测)甲、乙两名运动员在某项测试中的6次成绩的茎叶图如图所示, , 分别表示 甲乙两名运动员这项测试成绩的平均数,s1,s2分别表示甲乙两名运动员这项测试成绩的标准差,则有( ) (A)x1>x2,s1 (B)x1=x2,s1=s2 (D)x1=x2,s1>s2 解析:由样本中数据可知x1=15, x2=15, 由茎叶图得s1 2.(2013贵州省六校联考)某同学学业水平考试的9科成绩如茎叶图所示,则根据茎叶图可知该同学的平均分为 . 解析: 1720(68+72+73+78×2+81+89×2+92)= =80. 99答案:80 3.(2013北京市西城区期末)为了解学生的身体状况,某校随机抽取了一批学生测量体重.经统计,这批学生的体重数据(单位:千克)全部介于45至70之间.将数据分成以下5组:第1组[45,50),第2组[50,55),第3组[55,60),第4组[60,65),第5组[65,70],得到如图所示的频率分布直方图.现采用分层抽样的方法,从第3,4,5组中随机抽取6名学生做初检. (1)求每组抽取的学生人数; (2)若从6名学生中再次随机抽取2名学生进行复检,求这2名学生不在同一组的概率. 解:(1)由频率分布直方图知,第3,4,5组的学生人数之比为3∶2∶1. 所以,每组抽取的人数分别为: 第3组:第4组:第5组: 3×6=3; 62×6=2; 61×6=1. 6所以从第3,4,5组应依次抽取3名学生,2名学生,1名学生. (2)记“从6名学生中抽取2名学生不在同一组”为事件A, 则P(A)= 1111111C13C1?C2?C1?C3?C2=. 215C6考点三 样本的数字特征 1.(2012西安五校模拟)已知一组正数x1,x2,x3,x4的方差s=x1+2,x2+2,x3+2,x4+2的平均数为( ) (A)2 (B)3 (C)4 (D)6 解析:设x1,x2,x3,x4的平均值为x, 则s== 2 2 1222?x3?x4(x12?x2-16),则数据 412222 [(x1-x)+(x2-x)+(x3-x)+(x4-x)] 421222?x3?x4(x12?x2-4x), 4∴4x=16, 2
共分享92篇相关文档