当前位置:首页 > 医学统计学解答题
简答题
1、统计资料可以分成几类?
答: 根据变量值的性质,可将统计资料分为数值变量资料(计量资料),无序分类变量资料(计数资料),有序分类变量资料(等级资料或半定量资料)。用定量方法测定某项指标量的大小,所得资料,即为计量资料;将观察对象按属性或类别分组,然后清点各组人数所得的资料,即为计数资料;按观察对象某种属性或特征不同程度分组,清点各组人数所得资料称为等级资料。
2、不同类型统计资料之间的关系如何?
答: 根据分析需要,各类统计资料可以互相转化。如男孩的出生体重,属于计量资料,如按体重正常与否分两类,则资料转化为计数资料;如按体重分为: 低体重,正常体重,超体重,则资料转化为等级资料。计数资料或等级资料也可经数量化后,转化为计量资料。如性别,结果为男或女,属于计数资料,如男性用0(或1),女性用1(或0)表示,则将计数资料转化为计量资料。
3、频数分布有哪两个重要特征?
答:频数分布有两个重要特征:集中趋势和离散趋势,是频数分布两个重要方面。将集中趋势和离散趋势结合起来分析,才能全面地反映事物的特征。一组同质观察值,其数值有大有小,但大多数观察值集中在某个数值范围,此种倾向称为集中趋势。另一方面有些观察值较大或较小,偏离观察值集中的位置较远,此种倾向称为离散趋势。 4、标准差有什么用途?
答: 标准差是描述变量值离散程度常用的指标,主要用途如下: ①描述变量值的离散程度。两组同类资料(总体或样本)均数相近,标准差大,说明变量值的变异度较大,即各变量值较分散,因而均数代表性较差;反之,标准差较小,说明变量异度较小,各变量值较集中在均数周围,因而均数的代表性较好。②结合均数描述正态分布特征;③结合均数计算变异系数CV;④结合样本含量计算标准误。 5、变异系数(CV)常用于哪几方面?
答: 变异系数是变异指标之一,它常用于以下两个方面: ①比较均数相差悬殊的几组资料的变异度。如比较儿童的体重与成年人体重的变异度,应使用CV;②比较度量衡单位不同的几组资料的变异度。如比较同性别,同年龄人群的身高和体重的变异度时,宜用CV。 6、制定参考值范围有几种方法?各自适用条件是什么?
答: 制定参考值范围常用方法有两种: ①正态分布法: 此法是根据正态分布的原理,依据公式:
X±uS计算,仅适用于正态分布资料或对数正态分布资料。95%双侧参考值范围按: X±1.96S计算;95%单侧参考值范围是: 以过低为异常者,则计算: X-1.645S,过高为异常者,计算X+1.645S。若为对数正态分布资料,先求出对数值的均数及标准差,求得正常值范围的界值后,反对数即可。②百分位数法。用P2.5~P97.5估计95%双侧参考值范围;P5或P95为95%单侧正常值范围。百分位数法适用于各种分布的资料(包括分布未知),计算较简便,快速。使用条件是样本含量较大,分布趋于稳定。一般应用于偏态分布资料、分布不明资料或开口资料。
7、计量资料中常用的集中趋势指标及适用条件各是什么?
答: 常用的描述集中趋势的指标有: 算术均数、几何均数及中位数。①算术均数,简称均数,反映一组观察值在数量上的平均水平,适用于对称分布,尤其是正态分布资料;②几何均数: 用G表示,也称倍数均数,反映变量值平均增减的倍数, 适用于等比资料,对数
正态分布资料;③中位数: 用M 表示,中位数是一组观察值按大小顺序排列后,位置居中的那个观察值。它可用于任何分布类型的资料,但主要应用于偏态分布资料,分布不明资料或开口资料。
8、标准差,标准误有何区别和联系?
答: 标准差和标准误都是变异指标,但它们之间有区别,也有联系。区别: ①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差常用于表示变量值对均数波动的大小,与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误常用于表示样本统计量(样本均数,样本率)对总体参数(总体均数,总体率)的波动情况,用于估计参数的可信区间,进行假设检验等。③它们与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。联系: 标准差,标准误均为变异指标,如果把样本均数看作一个变量值,则样本均数的标准误可称为样本均数的标准差;当样本含量不变时,标准误与标准差成正比;两者均可与均数结合运用,但描述的内容各不相同。 9、统计推断包括哪几方面内容?
答: 统计推断包括: 参数估计及假设检验两方面。参数估计是指由样本统计量( 样本均数,率)来估计总体参数(总体均数及总体率),估计方法包括点值估计及区间估计。点值估计直接用样本统计量来代表总体参数,忽略了抽样误差;区间估计是按一定的可信度来估计总体参数所在的范围,按X±uσX或
X±uSX来估计。假设检验是根据样本所提供的信息,推断总体参数是否相等。 10、假设检验的目的和意义是什么?
答: 在实际研究中,一般都是抽样研究,则所得的样本统计量(均数、率)往往不相等,这种差异有两种原因造成: 其一是抽样误差所致,其二是由于样本来自不同总体。如果是由于抽样误差原因引起的差别,则这种差异没有统计学意义,认为两个或两个以上的样本来自同一总体,;另一方面如果样本是来自不同的总体而引起的差异,则这种差异有统计学意义,说明两个或两个以上样本所代表的总体的参数不相等。样本统计量之间的差异是由什么原因引起,可以通过假设检验来确定。因此假设检验的目的是推断两个或多个样本所代表的总体的参数是否相等。
11、何谓假设检验?其一般步骤是什么?
答: 所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后用适当方法根据样本所提供的信息,对所提出的假设作出拒绝或不拒绝的结论的过程。假设检验一般分为五个步骤: ① 建立假设:包括: H0,称无效假设;H1: 称备择假设;② 确定检验水准:检验水准用α表示,α一般取0.05;③ 计算检验统计量:根据不同的检验方法,使用特定的公式计算;④确定P值:通过统计量及相应的界值表来确定P值;⑤推断结论:如P>α,则接受H0,差别无统计学意义;如P≤α,则拒绝H0, 差别有统计学意义。 12、假设检验有何特点?
答: 假设检验的特点是: ①统计检验的假设是关于总体特征的假设;②用于检验的方法是以检验统计量的抽样分布为理论依据的;③作出的结论是概率性的,不是绝对的肯定或否定。
13、如何正确理解差异有无显著性的统计学意义?
答: 在假设检验中,如P≤α,则结论是: 拒绝H0,接受H1, 习惯上又称“显著”,此时不应该误解为相差很大,或在医学上有显著的(重要的)价值;相反,如果P>α,结论是不拒绝H0。习惯上称“不显著”,不应理解为相差不大或一定相等。有统计学意义( 差异有显著性)不一定有实际意义;如某药平均降低血压5mmHg, 经检验有统计学意义, 但在实
际中并无多大临床意义,不能认为该药有效。相反,无统计学意义,并不一定无实际意义。如用新疗法治疗某病,有效率与旧疗法无差异,此时无统计学意义,如果新疗法方法简便,省钱,更容易为病人接受,则新疗法还是有实际意义。
14、参考值范围与可信区间区别是什么?
答: (1)意义不同: 参考值范围是指同质总体中包括一定数量(如95%或99%) 个体值的估计范围,如95%参考值范围,意味该数值范围只包括95%的个体值,有5%的个体值不在此范围内。可信区间是指按一定的可信度来估计总体参数所在范围。如95%的可信区间,意味着做100次抽样,算得100个可信区间,平均有95个可信区间包括总体参数(估计正确)有5个可信区间不包括总体均数(估计错误)。(2)计算方法不同: 参考值范围用X±uαS计算。可信区间用X±tα、νSx或X±uαSx计算;前者用标准差,后者用标准误。 15、X检验有何用途?
答: X检验有以下应用: ①推断两个或两个以上总体率(或构成比)之间有无差别;②检验两变量之间有无相关关系;③检验频数分布的拟合优度。 16、四格表资料的u检验和X检验的应用条件有何异同?
答:(1) 相同点: 四格表资料的u检验是根据正态近似原理进行的,凡能用u检验对两样本率进行检验的资料,均能使用X检验,两者是等价的,即u=X;u检验和X检验都存在连续校正的问题。(2) 不同点:由于u分布可确定单、双侧检验界值,可使用u检验进行单侧检验;满足四格表u检验的资料,可计算两率之差的95%可信区间,以分析两率之差有无实际意义;X检验可用于2×2列联表资料有无关联的检验。 17、参数检验与非参数检验有何区别? 各有何优缺点?
答: 参数检验是检验总体参数是否有差别,而非参数检验是检验总体分布的位置是否相同。参数检验的优点是能充分利用样本资料所提供的信息,因此,检验效率较高。其缺点是有较严格的使用条件,如要求总体的分布呈态分布,各总体方差要相等,有些资料不满足使用条件,就不能用参数检验。非参数检验的优点是适用范围广。它不要求资料分布的形式,另外可用于等级资料或不能确切定量的资料。缺点是不能充分利用样本所提供的信息,因此检验效率较低,产生第二类错误较大。 18、非参数检验适用于哪些情况?
答: 非参数检验应用于以下情况: ①不满足参数检验的资料,如偏态分布资料;②分布不明的资料;③等级资料或开口资料。
19、直线回归与相关有何区别和联系?
答: 1、区别: ①在资料要求上,回归要求因变量y 服从正态分布,自变量x是可以精确测量和严格控制的变量,一般称为Ⅰ型回归;相关要求两个变量x、y服从双变量正态分布。这种资料若进行回归分析称为Ⅱ型回归。②在应用上,说明两变量间依存变化的数量关系用回归,说明变量间的相关关系用相关。2、联系: ①对一组数据若同时计算r与b,则它们的正负号是一致的;②r与b的假设检验是等价的,即对同一样本,二者的t值相等。③可用回归解释相关。
1、标准正态分布(u分布)与t分布有何异同?
相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时) 不同点:t分布是一簇分布曲线,t 分布的曲线的形状是随自由度的变化而变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为1。 3、简述直线回归与直线相关的区别。
1资料要求上不同:直线回归分析适用于应变量是服从正态分布的随机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布的资料。
2 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存关系,回归系数越大回归直线越陡峭,
2
2
2
2
2
2
2
2
表示应变量随自变量变化越快;相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越大,两个变量的关联程度越大。
第一章 医学统计中的基本概念
2、抽样中要求每一个样本应该具有哪三性?
从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。 (1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。 (2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。
(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。需要作“样本例数估计”。
3、什么是两个样本之间的可比性?
可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。
实习一 统计研究工作的基本步骤
(1) 什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别? 医学统计学:是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科 统计学:是研究数据的收集、整理、分析与推断的科学。
卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。
生物统计学:是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计,取样,分析,资料整理与推论的科学。
(2) 医学统计的资料主要来源于那些方面?有何要求?
医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等。实验数据是指在试验过程中活的的数据;现场调查资料主要来源于大规模的流行病调查获取的资料;医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等;报表有卫生工作基本情况年报表、传染年(月、日)报表、疫情旬(年、月、日)报表等;报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等。
这些资料的手机过程中,必须进行质量抗旨,包括它的统一性、确切性、可重复性。这些原始数据的精读和偏性应有明确的范围。
(3) 医学统计学的资料类型有哪些?
(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(10/L)、脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。
(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。
等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。
12
共分享92篇相关文档