当前位置:首页 > 第三部分、统计与概率
第三部分、统计和概率:
一、统计:统计主要研究现实生活的数据,它通过收集、整理、描述和分析数据,来帮助人们对事物
的发展作出合理的判断.统计所提供的“运用数据进行推断”的思考方法以及从随机性中寻找规律性这种归纳的思想是现代社会一种普遍使用的强有力的武器,能够利用数据信息和对数据进行处理已成为信息时代每一位公民必备的素质.
统计调查(即数据处理)的一般过程:收集数据、整理数据、描述数据、分析数据、得出结论. ⑴收集数据:1、全面调查;2、抽样调查.抽样调查分为简单随机抽样和分层抽样.在进行抽样调查时,抽取的样本要具有代表性、普遍性.
抽样调查的基本思想方法是用样本的特性来估计总体的特性. 抽样调查的几个概念:
◆ 总体:调查对象的调查目的的全体. ◆ 样本:从中抽取的部分的调查对象的调查目的. ◆ 个体:每一个调查对象的调查目的. ◆ 样本容量:样本中个体的数目(没有单位).
说明:全面调查和抽样调查是数据收集的两种方式,全面调查适用的调查对象是了解全面准确的情况,而抽样调查适用的调查对象是了解大致情况.另外,有些情况不适用于全面调查,只适用于抽样调查,如具有破坏性的调查.抽样调查虽然是非全面调查,但它能够反映总体的大体情况,也可起到全面调查的作用.
⑵整理数据:利用统计表格进行整理.运用统计表可以将大量数据的分类结果清晰、概括、一目了然地表达出来,明显地反映出事物的全貌及其蕴涵的特性,它把有关的数字列在一起,既便于分析、比较、计算和记忆,又便于发现错误和遗漏,省去冗长的文字叙述.
⑶描述数据:利用统计图表进行描述.统计图是在统计表的基础上,表现统计资料的一种形式,也是统计分析的一种重要工具.统计图把统计表中的数字形象化,利用几何图形反映数量间的对比关系,以直观形象的形式表达出事物的全貌及其分布特征.统计图只能表示近似数,要想了解准确的数字,仍需看统计表.
选用什么样的统计图来描述数据取决于两个方面:一是你面对的是什么样的数据,二是你要用统计图展示什么信息.
1、 条形统计图:条形图是以宽度相等的条形高度或长度来表示被研究现象数量的多少和比较图
示变量值大小的统计图形.其优点:能够显示每组中的具体数据,易于比较数据间的差异. 2、 扇形统计图:扇形图用扇形的大小表示部分在总体中所占百分比,直观地反映部分占总量的百
分比.其优点:易于显示每组数据相对于总数的大小.缺点:不能判断每组数的绝对大小. 3、 折线统计图:能够反映数据的变化情况. 4、 频数直方图:频数直方图是以小长方形的面积来反映数据落在各个小组内的频数的大小.小长
方形的高是频数与组距的比值.其优点:直接反映频数的大小.
说明:通常表示间断变量可用条形图、扇形图等,表示连续变量可用直方图、折线图等. ⑷分析数据:
(一)数据的集中程度 1、平均数
x1,x2,...,xn,且,那么
一般地,如果有n个数
x叫做这个数的平均数。
2、众数
在一组数据中出现次数最多的一个数或几个数,叫做这组数据的众数
3、中位数
将一组数据从小到大依次排列,把处在最中间位置的一个数据或最中间两个数据的平均数,叫做这组数据的中位数
(二)数据的离散程度 1、极差
一组数据中最大数据与最小数据的差,叫做这组数据的极差 2、方差
对于n个数x1,x2,...,xn,各数据与它的平均数的差的平方的平均数,叫做这组数据的方差.由上述定
S2?1义有计算公式
??x?x?n12?x2?x??2?...?xn?x???2其中S叫做这n个数x1,x2,...,xn,的方差.
2
二、概率: (一)、事件的分类
1.确定事件?必然事件:在一定条件??不可能事件:在一定条下重复进行试验时,在件下重复进行试验时,每次试验中必然发生的不可能发生的事件事件2.不确定事件(随机事件):在一定条件下,可能发生也可能不发生的事件
(二)、概率的意义和表示方法
m 1、一般地,在大量重复试验中,如果事件A发生的频率n会稳定在某个常数P附近,那么这个常数P叫做事件A的概率.
2、事件与概率之间的关系图
概率值0 1 不可能事件 随机事件 必然事件 (三)等可能事件的概率求法 1、等可能事件的特征
这类特殊事件一般具有以下两个共同的特点: ⑴一次试验中,可能出现的结果有很多个; ⑵一次试验中,各种结果的可能性相等. 2、等可能事件的概率求法
一般地,如果在一次试验中,有n种可能的结果,并且它们发生的可能性都相等,事件
mA包含其中的m种结果,那么事件A发生的概率为P(A)= 3、列举法求概率 (1)列举法的分类
n
◆列表法:用列出表格的方法来分析和求解某些事件的概率的方法.
◆画树状图法:用树状图的方法列出某事件的所有可能的结果,求出出现某种结果的概率的
方法.
(2)列表法和画树状图法的优点及运用条件
名称 列表法 画树状图法 优点 不重不漏,一目了然 不重不漏,一目了然 运用条件 当一次试验要涉及两个因素,并且可能出现的结果数目较多时,通常采用列表法. 当一次试验要涉及三个或多个因素时,通常采用画树状图法. (四)利用频率估计概率 1、利用频率估计概率
利用频率估计概率的三个条件:①每次试验都在相同条件下进行;②必须进行多次试验;?试验的可能结果不是有限个,或各种结果发生的可能性不相等. 2、模拟试验和随机数 模拟试验:统计科学中,常用较为简单的试验方法代替实际操作中复杂的试验来完成概率估计,这样的试验称为模拟试验.
随机数:随机事件中,需要用大量重复试验产生的一串随意的数据来开展统计工作,把这些随机产生的数据称为随机数.
模拟试验的前提条件:选择的替代物与原实际操作的试验必须保证在相同的条件下进行,即试验的结果及各种可能结果发生的可能性与实际操作的试验一致.
共分享92篇相关文档