当前位置:首页 > 医学论文撰写中的统计误用问题与对策
医学论文撰写中的统计误用问题与对策.
时间:2010-03-09 11:13来源:未知 作者:admin 点击:次
医学论文撰写中的统计误用问题与对策 目的 为医学论文撰写中正确使用统计方法提供参考。 方法 总结分析了医学论文在科研设计、资料描述与分析上存在的统计误用问题。 结果 医学论文中的统计误用主要包括:①实验设计违背随机、对照、重复和均衡原则;②数据描
· 医学论文撰写中的统计误用问题与对策
目的 为医学论文撰写中正确使用统计方法提供参考。
方法 总结分析了医学论文在科研设计、资料描述与分析上存在的统计误用问题。
结果 医学论文中的统计误用主要包括:①实验设计违背随机、对照、重复和均衡原则;②数据描述欠准确;③不考虑资料的特点,盲目套用统计分析方法;④结果表达与解释中混淆统计意义与实际意义。针对这些问题,提出了医学论文撰写中的注意事项和相应对策。
结论 医学论文中的统计误用问题普遍存在。医学科研工作者应加强学习,提高将实际问题转化为统计问题的能力。关 键 词 医学论文 统计误用中图分类号
医学统计学已广泛应用于医学科学研究和医疗卫生实践中,统计方法能否正确使用关系着研究结论的可信度,医学论文在文献复习与研究设计、实验、数据记录、资料分析、结果表达与解释等环节都涉及统计问题。但值得注意的是,医学论文中的统计误用问题十分普遍,50%以上的论文都有统计误用问题[1-3],涉及从实验设计到结果解释的各个环节[4]1。作者在编辑工作中,发现部分医学论文在科研设计、资料描述、统计方法的选用等方面存在一些问题,现总结报告如下。
1 常见统计学错误类别 1.1 实验设计中存在的错误部分论文忽视统计在实验设计中的重要地位,严重违反随机、对照、重复和均衡原则,在实验设计阶段就为统计误用埋下了伏笔。如实验组45例(男32例, 女13例),对照组12例(男4例,女8例),平均年龄分别为(66.5±10.8)岁和(59.0±11.4)岁,两组在总例数、性别、年龄等方面均不够一致,组间可比性差,如此科研设计得到的结论,其可信度值得怀疑。 1.2 统计表达和描述中存在的错误在论文中对实验数据和数据统计分析方法进行表述时,不妥当的表述方式往往使论文有失严谨,严重的还会使论文科学性遭到质疑。很多医学论文在对数据统计分布特征的描述、统计表和统计图的使用、统计术语的使用、对数据统计分析过程的描述等方面均存在问题。在表述定量资料时,不考察资料的分布,即使其偏离正态分布很远,仍盲目采用均数±标准差(-x±s) 的表达方式,如论文中数据描述为115.8±129.6。依 ·57·华南国防医学杂志
2009年第23卷 第6期据经验,通常状态下,标准差不会大于均值,对可疑数据应
说明其正态性。有的研究样本量较少,如5个专家对训练效果打分,这个分值采用均数±标准差(-x± s)的表达方式欠妥,需进行正态性检验或用中位数描述。有部分论文的数据存在编造嫌疑,如出现干预前后两组数据的方差完全一致的问题。关于统计方法的描述过于简单,常仅仅是“资料分析采用χ2检验”,或者“组间比较采用t检验”。 1.3 数据统计分析中存在的错误定量资料统计分析中存在的错误包括:①不考察定量资料是否满足参数检验的前提条件,盲目套用参数检验方法,如两组患者C反应蛋白测量值分别为 (51.42±40.75) mg/L和(16.18±15.63)mg/L,其方差相差甚远,不一定满足方差齐性的条件,不宜盲目套用方差分析方法比较两组的均值;②不以实验设计为基础,一律套用单因素两水平(或成组)设计定量资料的t检验或单因素多水平设计定量资料的方差分析方法。有些本来应该采用配对t检验,但却错误的采用了成组设计的t检验;多个样本均数的多重比较,本应采用SNK-q或者LSD-t检验,却采用了一般的t检验方法。定性资料统计分析中存在的错误主要是,不考察资料的特点,盲目套用χ2检验方法。如两组总例数分别为7例和18例,均小于40,两组比较时应采用 Fisher精确检验。对于等级资料,如比较几种治疗方法的疗效,应采用秩和检验,采用χ2检验只能说明各处理组结构是否均衡,不能说明效应是否有差别。对含有多因素或多自变量的实验资料进行分析时的错误包括:①将多因素实验研究问题拆分成一系列单因素研究,割裂了原本的整体研究,无法获得多个因素之间的内在联系或交互作用。如考察不同部位、不同类别手术所需时间的差异,作者对每个部位各类别的手术时间、每个类别各个部位的手术时间进行成组设计的t检验。该定量资料涉及手术部位、手术类别两个因素,是两因素析因设计。当资料满足参数检验的前提条件时,应选用相应的方差分析方法。②医学科研工作中,常需对接受不同处理的受试者在不同时间点、不同测试率、不同模式、对称部位(如左、右耳)上进行重复观测。重复测量设计资料的统计分析方法与其他多元统计分析方法一样,是比较复杂的。很多论文常常忽略资料获取的设计类型,盲目套用t检验,简单的做各个时刻点、各部位观测值的对比。
如考察两组动物致伤前、后(伤后5min、1h、3h、6h)呼吸、心率等指标的变化,用t检验直接比较不同组动物同一时刻数据或同组伤前数据,这样做会大大增加假阳性错误率。 1.4 统计学结果表达与解释中存在的错误统计学结果表达与解释中最常见的错误是混淆了统计意义与实际意义。如陈述时说“二者相比差别非常显著”,这是不妥的,因为“显著性”是统计学概念,只能说明P值有无统计学意义,不能说明“差别”有无意义。有些论文在解释统计学结果时,功利性太强,不够客观严谨,给读者以误导。如统计得到空腹血清抵抗素浓度与血清胰岛素浓度的相关系数r=0.302,P< 0.05,据此认为二者之间有“密切关系”,此表达欠严谨。因为对相关系数的假设检验P<0.05,仅说明二者之间存在线性相关关系,但线性关系的密切程度,需借助r2(决定系数)的数值大小来度量。本例r2= 0.09,说明血清胰岛素浓度的变化中仅有9%与空腹血清抵抗素浓度有关,说明二者的线性相关程度比较低。 1.5 其他问题同一个表内同一个指标的小数位不一致;各分项数据之和与合计值不相等;数据分组方式混乱,表述不清;数据前后矛盾,如关于入组对象的例数摘要和正文中不相吻合,正文中的数据与图表中的数据不一致。 2 避免统计误用的对策 2.1 实验设计的撰写方法实验设计的基本要素包括处理因素、实验对象和实验效应。处理因素是研究者能施加或观察、能作用于研究对象并引起某种效应的因素,也称实验因素。实验可能会受到一些混杂因素的影响和污染,设计实验时必须注意这些因素及其控制方法。选择实验对象要依据严格的纳入和排除标准。实验效应一般通过观测指标来表达,指标应具有客观性、有效性和准确性。实验设计的基本原则是随机原则、对照原则、重复原则、均衡原则。随机化应贯穿于实验对象抽样、分组及实验实施过程之中。设置对
照组时,除研究因素外,其他因素需与实验组对等,两组在整个实验过程中需做到时空同步。在实验设计较为复杂,实验因素和水平较多时要特别注意重复原则,要确保每种分组方式之下都能进行重复观测。均衡是各组之间除了实验因素有计划地选取不同水平外,在其他一切非实验因素上完全相同。
论文中应详细交待实验设计中三要素、四原则的有关内容,包括实验对象的纳入和排除标准、分组方法;非实验因素的控制方法;观测指标的仪器与方法;研究设计类型(观察型还是实验型;单因素设计、多 ·58·华南国防医学杂志 2009年第23卷 第6期因素析因设计、多因素重复测量设计、多因素非平衡的组合试验)[5]7-13。 2.2 数据表述方法定量数据服从正态分布时,才能采用均数±标准差(-x±s)的表达方式。检验数据是否满足正态性,实践中主要根据专业知识和经验判断。有些医学指标如身高、体重、血细胞数量、血压等是服从正态分布的,对其不必做正态性检验;但若样本数较少或者缺乏相关先验信息时,应对资料进行正态性检验。检验方法包括图示法和计算法。图示法简便易行,可粗略了解资料的分布特点,主要有频率-频率图(proportion-pro- portion plot, P-P plot)和分位数-分位数图(quan- tile-quantile plot, Q-Q plot)。
计算法是对数据进行严格的正态检验,常用W检验法(Shapiro-Wilk检验) 和D检验法(D′Agostino检验)。这两种方法一般的统计软件均能提供。 2.3 数据分析方法分析数据时应特别注意参数检验方法的适用范围。t检验或方差分析都属于参数检验方法。一般来说,适合选用t检验的实验设计类型只有3种,即单组设计、配对设计和成组设计;而适合选用方差分析的设计类型有十几种,医学论文中采用较多的包括单因素 K水平设计(K>2)、析因设计和重复测量设计。在进行具体方差分析时,这些不同设计之间有较大的区别[6]。因此,在说明数据分析方法时,不应笼统地说 “方差分析”,而应当说明是“×××设计资料的方差分析”。使用t检验或方差分析,要求数据满足正态性和方差齐性。正态性应按照2.2中的方法进行检验,方差齐性应采用F检验、Barlett检验和Levene检验推断。常用的统计软件如SPSS也提供了方差不齐时的近似t检验和近似F检验结果,可供参考。重复测量设计资料的统计分析方法比较复杂,采用方差分析时需要注意[2][4]50-60:仅适用于各处理组例数相等时;需利用“球对称”系数对F值的自由度进行精确校正,要借助统计软件实现;如果“处理”与重复因素(如时间、对称部位)等存在交互作用时,仅分析“处理”主效应没有意义。对定性资料分析时,不能盲目套用χ2检验。有如下几点需要注意[3][5]160-161:①χ2检验主要用于考察频数分布规律是否相同,得到具有统计意义的结果后只能认为各总体率或者构成比之间存在总的差别,要说明彼此都有差别还需进一步进行两两比较;②对行× 列表资料进行χ2检验时,若有1/5以上的格子理论频数小于5,或任一格子理论频数小于1,则应采用确切概率法;③如果列表中的资料是有序的,如实验分组变量(不同的药物浓度)或者有序指标(如按等级分组的疗效),则应采用秩和检验、Ridit分析或者Logistic回归分析;④考察有序变量的相关关系,一般应采用 Spearman秩相关分析。 2.4 统计结果的表达统计作为一种工具,往往受到使用者本人主观意愿的制约,在统计指标的选择、统计图表的制作、统计方法的选用上都可能会带有个人目的,具有一定的功利性。因此,在统计学结果的解释中应该坚持客观严谨的态度,否则就会对读者造成误导。根据相关的标准和行业规范,在表述统计结果时,
共分享92篇相关文档