当前位置:首页 > 卫生统计学习指导(新)
第二章 定量变量的统计描述
本章大纲要求
【掌握】各种集中趋势指标的计算及其适用条件,各种离散趋势指标的计算及其适用条件。
【熟悉】频数分布表编制步骤,并据此描述资料的频数分布特征;统计表和定量资料统计图。
【了解】描述分布形态的统计指标;了解描述分布形态的偏度系数与峰度系数的计算和意义。 【重点内容详解】
第一节 数值变量的频率分布表
一、离散型定量变量的频率分布
对离散型定量变量,变量值的取值是不连续的。直接清点各变量值出现的频数,即为频率分布表。离散型定量变量的频率分布图可用直条图表达,以各等宽矩形直条的高度表示各组频率的多少。 二、连续型定量变量的频率分布
对连续型定量变量,变量值的取值是连续的。将数据适当分组,清点各组的频数,即为频率分布表。连续型定量变最的频率分布图可用直方图表达,其纵坐标为频率密度,即频率/组距,南方图的面积之和等于l。 三、频率分布表(图)的用途
频率分布表(图)可以揭示资料的分布类型;也可以描述资料的分布特征,即集中趋势和离散趋势,便于发现某些特大和特小的可疑值;便于进一步计算指标和统计分析。
第二节 描述集中趋势的统计指标
对于连续型定量变量,平均数是应用最广泛、最重要的一个指标体系,它常用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。常用的平均数有3种:算术均数、几何均数和中位数。 一、算术均数:
1、意义:简称均数,常用μ表示总体均数,x表示样本均数,反映全部观察 值的平均数量水平。
5
?2、适用条件:适用于对称分布资料,尤其正态或近似正态分布资料。 二、几何均数
1、意义:几何均数以符号G表示,常用来反映一组含多个数量级数据的集中位置。
2、适用条件:适用于原始观察值分布不对称,但经对数转换后呈对称分布的资料,如对数正态分布资料。观察值间常呈倍数关系,或变化范围跨越多个数量级。 三、中位数
1、意义:将一组变量值按从小到大或从大到小的顺序排列后,位次居中的变量值。
2、适用条件:适用于各种分布类型的资料,特别是偏峰分布的资料;亦可用于分布末端无确定值的资料。
第三节 描述离散趋势的统计指标
同一总体中不同个体间存在的差异称为变异。为比较全面地把握资料的分布特征,不仅需要了解数据的集中位置,而且需要了解数据的离散程度。常用的描述离散趋势的统计量包括极差、四分位数间距、方差、标准差和变异系数。 一、极差
1、意义:也称全距,以R表示,是一组变量值中最大值和最小值的差。 2、适用条件:所有资料。 二、四分位数间距
1、意义:四分位数间距即为Q75与Q25之差。
2、适用条件:适用于偏态分布资料,比全距稳定,但仍未考虑每个变量值的变异程度。 三、方差
1、意义:方差考虑了全部观察值的变异程度。总体方差用σ表示,定义为观察值离均差平方和的算术均数;样本方差用S2表示,是总体方差的无偏估计。同类资料比较时,方差越大意味着数据问变异度越大。 2、适用条件:见标准差。 四、标准差
1、意义:方差的算术平方根称为标准差.总体标准差用σ表示,样本标准差用
6
2
S表示。标准差的量纲与原变量一致,故实际应用中常使用标准差。同类资料比较时,标准差越大意味着观察值间变异度越大。
2、适用条件:方差和标准差都适用于对称分布的资科,特别对正态分布或近似正态分布资料,常把均数和标准差结合起来,全面描述资料的集中趋势和离散趋势。
五、变异系数
1、意义:变异系数用CV表示,为标准差与算术均数之比,是一个不带量纲的相对数。
2、适用条件:量纲不同的变量及均数相差悬浮比较大的变量。
第四节 描述分布形态的统计指标
一、偏度系数
意义:理论上总体偏度系数为0时,分布是对称的;取正值时,分布为正偏
峰。取负值时分布为负偏峰。 二、峰度系数
意义:理论上正态分布的总体峰度系数为0,取负值时,其分布较正态分布的峰平阔;取正值时,其分布较正态分布的峰尖峭。 【自测练习题】
一、选择题
(一)Al型
每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。 1、用频率表计算平均数时,各组的组中值应为____。 A 本组段变量值的平均数 B本组段变量值的中位数
C本组段的上限值 D本组段的下限值 E(本组段上限值十本组段下限值)/2 2、离散型定量变量的频率分布图可以用____表达。
A直方图 B直条图 C百分条图 D箱式图 E复式条图 3、变异系数越大说明____。 A标准差越大 B平均数越大
C标准差、平均数都大 D平均数小 E 以均数为准变异程度大 4、均数和标准差的关系是____。
7
A均数越大,标准差越小 B均数越大,标准差越大 C标准差越大,均数对各变量值的代表性越好 D标准差越小,均数对各变量值的代表性越好 E均数和标准差都可以描述资料的离散趋势
5、已知某疾病患者10人的潜伏期(天)分别为l6,13,5,9,12,10,8,11,8,>20。其潜伏期的平均水平约为____天。 A 9 B 9.5 C lO D 10.2 E ll
6、已知某地一群7岁男童身高均数为lOOcm,标准差为5cm;体重均数为20kg,标准差为3kg,则身高和体重的变异程度有____。 A 身高的变异程度大于体重的变异程度 B 身高的变异程度等于体重的变异程度 C身高的变异程度小于体重的变异程度 D身高的变异程度与体重的变异程度之比为5:3 E因单位不同,无法比较
7、测得200名正常成年男子的血清胆固醇值(mmol/L),为进行统计描述,下列说法不正确的是____。
A可用频率表法计算均数 B可用直接法计算均数 C可用直接法计算标准差 D可用加权法计算标准差 E可用直条图表示频率分布图 (二)A2型
以下提供若干案例,每个案例下设若干道题目。请根据题目所提供的信息,在每一道题下面的A、B、C、D、E五个备选答案中选择一个最佳答案。 调查测定某地107名正常人尿铅含量(mg/L)如下:
尿铅含量 O~ 4~ 8~ 12~ 16~ 20~ 24~ 28~ 合计 例数 14 22 29 18 15 6 1 2 107 1、描述该资料的集中趋势,宜用____。
A均数 B中位数 C几何均数 D众数 E极差 2、描述该资料的离散趋势,宜用____。
A极差 B 方差 C 四分位数间距 D 标准差 E 变异系数
8
共分享92篇相关文档