当前位置:首页 > 第二章计量资料的统计描述
第二章 计量资料的统计描述
一、教学大纲要求
(一)掌握内容
1. 频数分布表与频数分布图 (1)频数表的编制。 (2)频数分布的类型。 (3)频数分布表的用途。 2. 描述数据分布集中趋势的指标
掌握其意义、用途及计算方法。算术均数、几何均数、中位数。 3. 描述数据分布离散程度的指标
掌握其意义、用途及计算方法。极差、四分位数间距、方差、标准差、变异系数。 (二)熟悉内容
连续型变量的频数分布图:等距分组、不等距分组。
二、 教学内容精要
计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。
(一)频数分布表的编制
频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20个病人的天数。如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。制作连续型数据频数表一般步骤如下:
1.求数据的极差(range)。
R?Xmax?Xmin (2-1) 2.根据极差选定适当“组段”数(通常8—10个)。
确定组段和组距。每个组段都有下限L和上限U,数据χ归组统一定为L≤χ
频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理。
(二)描述频数分布中心位置的平均指标
描述中心位置的平均指标,但常因资料的不同而选取不同的指标进行描述。
1.算术均数
算术均数(arithmetic mean)简称均数,描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X表示,其计算方法如下: (1)直接法:直接用原始观测值计算。
X??X (2-2)
n(2)加权法:在频数表基础上计算,其中X为组中值,f为频数。
X?2.几何均数
?fX (2-3) ?f 几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。其计算公式为:
(1)直接法
?lgX? (2-4) G?lg?1? ???n?(2)加权法
?flgX? (2-5) G?lg?1? ????f???3.中位数
中位数(median)将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。
为奇数时 M?X?n?1? (2-6)
???2??1?为偶数时 M??Xn?Xn? (2-7)
(?1)2?(2)2?
2-1 常用平均数的意义及其应用场合
平均数 均数
意义 平均数量水平
应用场合
应用甚广,最适用于对称分布,特别是正态分布
等比资料;对数正态分布
几何均数 平均增(减)倍数 中位数
位次居中的观察值水平 偏态分布;分布不明;分布末端无确定值
(一)反映数据变异程度大小的变异指标
变异指标的应用亦根据资料的不同而选取不同指标进行描述。常用的变异指标有极差、
四分位数间距、方差、标准差和变异系数,尤其是方差和标准差更为常用。
1.极差
极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。
R?Xmax?Xmin (2-1) 2.百分位数与四分位数间距
(1)百分位数(percentile)是将n个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学正常参考值范围。 百分位数用Px表示,0< x <100,如25%位数表示为P25。在频数表上,百分位数的计算公式为: Px?Lx?ix?n?x%??fL? (2-8) fx(2)四分位数间距(inter-quartile range)是由第3四分位数(Q3= P75)和第1四分位数(Q1= P25)相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,比极差稳定。其计算公式:
QR?Q3?Q1 (2-9)
3.方差
方差(variance)表示一组数据的平均离散情况,其计算公式为:
2??X???2 (2-10)
S?n?14.标准差
标准差(standard deviation)是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用,其计算公式为:
S???X?X?n?12?(X)2?X??n?12n (2-11)
5.变异系数
共分享92篇相关文档