当前位置:首页 > 《医学统计学》讲稿
第二章 数值变量(计量)资料的统计分析
第一节 计量资料的统计描述 一、计量资料的频数分布
(一)频数表的编制
1、求极差(全距)
R=最大值-最小值 =132.5-108.2=24.3 2、求组距(i)
i=极差/组数=24.3/10=2.4≌2 3、分组段
原则:第一组段包括最小值,最后组段包括最大值。 每一组段都有上限和下限 上限:组段的终点(最大值) 下限:组段的起点(最小值) 4、列表划记
(二)频数分布的特征
1、集中趋势:数据向某一数值集中的倾向 2、离散趋势:数据的数值大小不等的倾向
(三)频数分布的类型
1、对称分布: 集中位置在中间,左右两侧频数大体对称 2、偏态分布:
(1)正偏态:集中位置偏向数值小的一侧; (2)负偏态:集中位置偏向数值大的一侧 (四)频数表的用途:
1、揭示资料的分布特征和分布类型 2、便于进一步计算指标和统计分析 3、便于发现特大或特小的可疑值
5
二、集中趋势的描述
(一)常用平均数的种类: 1、算术均数(简称均数) 2、几何均数 3、中位数
(二)算术均数(均数)
样本均数用X表示,总体均数用μ表示
1、适用范围:对称分布,尤其是正态分布的资料 2、计算方法:
(1)直接法 X=∑X / n
(2)加权法 适用于频数表资料 X=∑fX / ∑f
其中 X=组中值=(上限+下限)/ 2 f=频数 (三)几何均数(简记为G) 1、适用范围:
(1)等比级数资料,如血清滴度资料 (2)对数正态分布资料 2、计算方法:
(1)直接法
G=log-1(∑logX/n) (2)加权法
G=log-1(∑flogX/∑f)
(四)中位数(简记M) 1、中位数的定义:
中位数: 将一组观察值从小到大按顺序排列,位次居中的观察值就是中位数。在全部观察值中,大于和小于中位数的观察值的个数相等。 2、中位数的适用范围: (1)偏态分布资料 (2)分布不明资料
(3)分布末端无确定值资料(开口资料)
理论上,中位数可用于任何分布的计量资料, 但实际应用中常用于偏态分布,特别是开口资料。在对称分布资料中,M=X 3、计算方法:
(1)直接法:适用于观察数少资料 n为奇数时, M=X(n+1)/2
n为偶数时, M=(Xn/2+X(n/2+1))/2 (2)频数表法:适用于频数表资料
步骤:①从小到大计算累计频数和累计频数; ②确定中位数所在组段; ③计算中位数M
M=LM+iM/fM(n/2-∑fL) LM=M所在组段的下限
6
iM=M所在组段的组距 fM=M所在组段的频数
∑fL=小于L各组段的累计频数
M在8~组段 L=8 i=4 fX=48
∑fL=26 n=108
M=L+i/fX(n/2-∑fL)=10.33
(五)小结: 常用平均数的意义及其应用场合
平均数 意义 应用场合 ───────────────────────── 均数 平均数量水平 最适用于对称分布,特别是 正态分布
几何均数 平均增(减)倍数 等比资料或对数正态分布 中位数 位次居中的观察值 (1)偏态分布,(2)分布不明, (3)分布末端无确定水平
三 离散趋势的描述
甲组 26, 28, 30, 32, 34. X甲=30 乙组 24, 27, 30, 33, 36. X乙=30 丙组 26, 29, 30, 31, 34. X丙=30 (一)反映离散程度的常用指标: 1、极差
2、四分位数间距 3、方差 4、标准差 5、变异系数
(二)极差(全距)R
1、计算公式:R=最大值-最小值
2、意义:R愈大,离散度愈大,R愈小,离散度愈小。 3、优点:计算简单,意义明了 4、缺点:(1)不能反映每一个观察值的变异; (2)样本例数越大,R可能越大; (3)R抽样误差大,不稳定。 (三)四分位数间距(简记Q) 1.百分位数(记作PX)
(1)定义:将一组观察值从小到大按顺序排列, 一个百分位数将全部观察值分为两部分,
7
理论上有x%的观察值比它小,有(100-x)%的观察值比它大。P50分位数也就是中位数。 (2)计算步骤与公式
①从小到大计算累计频数和累计频数; ②确定百分位数所在组段; ③计算百分位数Px
Px=L+i/fx(n.x%-∑fL) L=Px所在组段的下限 i=Px所在组段的组距 fx=Px所在组段的频数
∑fL=小于L各组段的累计频数 如计算P25
P25 在8~组段
L25=8,i25=4 ,f25=48,∑fL=108,n=108 P25=L25+i25/f25(n.25%-∑fL)=8.083 计算P75
P75 在12~组段
L75=12,i25=25 ,f75=4,∑fL=74,n=108 P75=L75+i75/f75(n.75%-∑fL)=13.120 2. 四分位数间距
(1)计算公式: P25: 下四分位数 简记QL P75: 上四分位数 简记QU 四分位数间距Q=QU-QL =13.120-8.083 =5.037
(2)意义:中间一半观察值的极差,与R意义相似。 (3)特点:
A.比R稳定,但仍未考虑每一个观察值的变异; B.常用于描述偏态资料的离散度。
(四)方差(总体方差简记σ2,样本方差简记S2) 一组观察值的离均差平方和,取其均数,即方差。 1、计算公式:
N2(x?x)?s2?n?1
??2?(x??)2
2、意义: 方差越大,离散度越大; 方差越小,离散度越小。
(五)标准差(总体标准差简记σ,样本标准差简记S) 1、定义:方差的开方,即标准差。
8
共分享92篇相关文档