云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > 数据分布特征的描述讲义

数据分布特征的描述讲义

  • 62 次阅读
  • 3 次下载
  • 2025/5/3 14:56:12

(二)总体的方差和标准差

2?1.设总体的方差为,标准差为?,对于未分组整理的原始资料,方差和标准差的计算公式分

别为:

?2?i?1?(Xi?X)NN2

??i?1?(Xi?X)NKN2

2.对于分组数据,方差和标准差的计算公式分别为:

?2??i?12?(Xi?X)Fi

Ki?1?FiK???i?12?(Xi?X)Fi

i?1?FiK(三)样本的方差和标准差

样本的方差、标准差与总体的方差、标准差在计算上有所差别。总体的方差和标准差在对各个离差平方平均时是除以数据个数或总频数,而样本的方差和标准差在对各个离差平方平均时是用样本数据个数或总频数减1(自由度)去除总离差平方和。

设样本的方差为s,标准差为s,对于未分组整理的原始资料,方差和标准差的计算公式为:

2 S2n?1?i?1?(xi?x)n?12n2

Sn?1?ki?1?(xi?x)n?1n2

对于分组数据,方差和标准差的计算公式为:

2Sn?i?1?1??(xi?x)fi

i?1k?fi?1kSn?1??i?12?(xi?x)fi

i?1?fi?1k22S?n当很大时,样本方差与总体的方差的计算结果相差很小,这时样本方差也可以用总体

方差的公式来计算。

六、相对离散程度:离散系数 (一)概念

前面介绍的全距、平均差、方差和标准差都是反映一组数值变异程度的绝对值,其数值的大小,不仅取决于数值的变异程度,而且还与变量值水平的高低、计量单位的不同有关。所以,不宜直接利用上述变异指标对不同水平、不同计量单位的现象进行比较,应当先做无量纲化处理,即将上述的反映数据的绝对差异程度的变异指标转化为反映相对差异程度的指标,然后再进行对比。

1.各种变异指标与其相应的算术平均数之比 2.消除了数据水平高低和计量单位的影响 3.测度了数据的相对离散程度

4.用于对不同总体数据离散程度的比较

5.离散系数通常用V表示,常用的离散系数为标准差系数。 (二)标准差系数

1.标准差与其相应的均值之比

9

2.消除了数据水平高低和计量单位的影响 3.测度了数据的相对离散程度

4.用于对不同组别数据离散程度的比较 计算公式为

?SV??或Vs?Xx第三节 数据分布偏态与峰度的测定

集中趋势和离中趋势是数据分布的两个重要特征,但要全面了解数据分布的特点,还需要知道

数据分布的形状是否对称、偏斜的程度以及分布的扁平程度等。偏态和峰度就是对这些分布特征的描述。偏度是对数据分布在偏移方向和程度所作的进一步描述;峰度是用来对数据分布的扁平程度所做的描述。对于偏斜程度的描述用偏态系数,扁平程度的描述用峰度系数。

一、动差法

动差又称矩,原是物理学上用以表示力与力臂对重心关系的术语,这个关系和统计学中变量与权数对平均数的关系在性质上很类似,所以统计学也用动差来说明频数分布的性质。

一般地说,取变量的a值为中点,所有变量值与a之差的K次方的平均数称为变量X关于a的K阶动差。用式子表示即为:

?(X?a)KN

当a?0时,即变量以原点为中心,上式称为K阶原点动差,用大写英文字母M表示。

一阶原点动差:

M1??XN ,即算术平均数

?X2M2?N ,即平方平均数 二阶原点动差:

?X3M3?N ,等等 三阶原点动差:

当a?X时,即变量以算术平均数为中心,上式称为K阶中心动差,用小写英文字母m表示。

一阶中心动差:

m1??(X?X)?0N

?(X?X)2m2???2N二阶中心动差: ?(X?X)3m3?N三阶中心动差: ,等等

10

二、偏态及其测度

偏态是对分布偏斜方向及程度的度量。从前面的内容中我们已经知道,频数分布有对称的,有不对称的即偏态的。在偏态的分布中,又有两种不同的形态,即左偏和右偏。我们可以利用众数、中位数和算术平均数之间的关系判断分布是左偏还是右偏,但要度量分布偏斜的程度,就需要计算偏态系数了。

采用动差法计算偏态系数是用变量的三阶中心动差m3与?进行对比,计算公式为:

3??

m3?3

当分布对称时,变量的三阶中心动差m3由于离差三次方后正负相互抵消而取得0值,则??0;当分布不对称时,正负离差不能抵消,就形成正的或负的三阶中心动差m3。当m3为正值时,表示正偏离差值比负偏离差值要大,可以判断为正偏或右偏;反之,当m3为负值时,表示负偏离差值比正偏离差值要大,可以判断为负偏或左偏。m3

越大,表示偏斜的程度就越大。由于三阶中心动差m33含有计量单位,为消除计量单位的影响,就用?去除m3,使其转化为相对数。同样的,?的绝对值越大,表示偏斜的程度就越大。 三、峰度及其测度

峰度是用来衡量分布的集中程度或分布曲线的尖峭程度的指标。计算公式如下:

4?(X?X)Fi

?4???4?4??Fim4分布曲线的尖峭程度与偶数阶中心动差的数值大小有直接的关系,心动差将

m2是方差,于是就以四阶中

m4来度量分布曲线的尖峭程度。m4是个绝对数,含有计量单位,为消除计量单位的影响,

m4除以?4,就得到无量纲的相对数。衡量分布的集中程度或分布曲线的尖峭程度往往是以正态

m4分布的峰度作为比较标准的。在正态分布条件下,4=3,将各种不同分布的尖峭程度与正态分布

?比较。

当峰度α4>3时,表示分布的形状比正态分布更瘦更高,这意味着分布比正态分布更集中在平均数周围,这样的分布称为尖峰分布,如下图a;α4=3时,分布为正态分布;α4<3,表示分布比正态分布更扁平,意味着分布比正态分布更分散,这样的分布称为扁平分布如下图b。

频数 频数 X

X (b)扁平分布 11

(a)尖峰分布

图3.4尖峰分布与平峰分布示意图

(六)本章难点

1、集中趋势测度指标的计算方法与应用场合; 2、离散程度测度指标的计算方法与应用场合;

3、如何正确运用离散程度指标评价总体平均水平的代表性; 4、对标准差、方差等指标含义的准确理解。 5、偏态与峰度指标的计算方法。

(七)复习思考题

1、考察一个分布数列的特征时,为什么必须同时运用集中趋势指标和离散程度指标? 2、描述数据集中趋势特征的指标有哪些,并简述其测定方法?

3、试比较极差、平均差和标准差三种变异指标的特点,并说明为什么标准差是最常用、最基本的变异指标?

4、试比较算术平均数、调和平均数、几何平均数、中位数与众数的特点。

12

搜索更多关于: 数据分布特征的描述讲义 的文档
  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

(二)总体的方差和标准差 2?1.设总体的方差为,标准差为?,对于未分组整理的原始资料,方差和标准差的计算公式分别为: ?2?i?1?(Xi?X)NN2 ??i?1?(Xi?X)NKN2 2.对于分组数据,方差和标准差的计算公式分别为: ?2??i?12?(Xi?X)Fi Ki?1?FiK???i?12?(Xi?X)Fi i?1?FiK(三)样本的方差和标准差 样本的方差、标准差与总体的方差、标准差在计算上有所差别。总体的方差和标准差在对各个离差平方平均时是除以数据个数或总频数,而样本的方差和标准差在对各个离差平方平均时是用样本数据个数

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com