当前位置:首页 > 统计学第四章第三节
第二节 离散程度的测度
10天
道森供应公司 克拉克批发公司
0.5 0.5 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 9 10 11 工作日数 7 8 9 10 11 12 13 14 15 工作日数
集中趋势只是数据分布的一个特征,数据的离中趋势是数据分布的另一个重要特征。两者是反映总体数据分布特征的一对对立统一的代表值。
一、 离散程度指标,又称标志变异指标,标志变动度。 (一)定义
就是总体各项标志值差别大小的程度。
(二)应用
1.主要是评价平均数代表性的依据。平均数的代表性与标志变动度的数值成反比。
例如:有甲乙两组工人,人数都是5人。每人每日产量: 甲:5 20 45 85 95 乙:48 49 50 51 52
平均数 50
95-5 90
52-48 4
2.标志变动度可以用来反映社会生产和其他社会经济活动过程的均衡性或协调性。
标志变动度小,就说明生产或经济活动各阶段变动幅度小,是均衡的协调的,反之,就是不均衡,不协调的。
二、 测量标志变动度的主要方法
(一) 异众比率——分类数据,顺序数据,数值型数据
1 定义:异众比率,即非众数组的频数占总频数的比率。 2 公式:
Vr=(∑fi —fm)/ ∑fi =1—fm/ ∑fi
∑fi变量值的总频数, fm众数组的频数。
3 作用:主要用于衡量众数对一组数据的代表程度。 异众比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性就越差;反之,异众比率越小,说明非众数组的频数占总频数的比重越小,众数的代表性越好。
4 适用范围:测定分类数据(也可以是顺序数据,数值型数据)的离散程度
饮料品牌 频数 可口可乐 15 旭日升 11 百事可乐 9 汇源果汁 6 露露 9 合计 50
异众比率 解:
Vr=(∑fi —fm)/ ∑fi =1—fm/ ∑fi
=(50—15)/50 =35/50=0.7=70%
(二)四分位差 ——顺序数据 数值型数据 1 定义:上四分位数和下四分位数之差。
2 公式: Qd=Qu—Ql
3 作用:
反映了中间50%数据的离散程度。
其数值越小,说明中间的数据越集中,数值越大,说明中间的数据越分散。 常常和中位数一起使用
4 特点:四分位差不受极值的影响。
例如:在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据如下(单位为元),计算人均月收入的四分位差
1500 750 780 1080 850 960 2000 1250 1630
解: 先按大小顺序排队
750 780 850 960 1080 1250 1500 1630 2000 QL位次
(n+1)/4 =(9+1)/4=2.5
QL=(780+850)/2=815(元)
QU位次
3(n+1)/4 =3(9+1)/4=7.5
QU=(1500+1630)/2=1565(元)
四分位差 Qd=Qu—Ql
=1565—815=750(元)
(三)全距(极差)——数值型数据
1 全距——是一个数列中两个极端数值之差。(最大值-最小值) 组距数列,以最大一组的上限和最小一组的下限之差为全距。
例如:
甲:5 20 45 85 95
乙:48 49 50 51 52甲组全距=95-5=90 乙组全距=52-48=4
一般地说,全距数值愈小,标志变动度愈小,反映变量值愈集中,反之,越大。
2 评价:意义明确,计算简单。
但不考虑中间变量,受极端值影响。有时根本反映不出差异程度。
10 20 30 40 50 60 70 80 90 100 55 90 10 50 50 50 50 60 60 60 60 100 55 90
(四)平均差
1定义:各标志值对其算数平均数的平均离差 2公式
(五)标准差
1 定义
各标志值对其算数平均数的平均离差
2简单式(未分组资料) 3加权式(分组资料)
如果是样本资料,将来要推断总体的,方差及标准差的公式就是:分母用样本数据个数减1:n—1 ——n—1 称为自由度。
公式为:
为什么样本方差是用自由度n—1去除?
样本方差的表达式 中的分子,为 n个量的平方和,为何自由度只有 n—1 、
这是因为这n个离差并不能自由变化,而是受到一个约束,即离差之和等于零,这使它的自由度少了一个。在样本方差公式中的分母上是n—1,就是因为当给
共分享92篇相关文档