云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > 统计简答

统计简答

  • 62 次阅读
  • 3 次下载
  • 2025/7/13 4:34:42

第一章

1、医学统计工作的步骤 (1)设计;(2)搜集资料;来源:医学领域的统计资料主要来自三个方面,统计报表,经常性工作记录,专题调查或专题实验;要求:统计学对原始资料的要求是完整、准确、及时;贮存:注意资料的时效性、磁盘备份等。(3)整理资料:检查核对准确性和完整性,设计分组,拟定整理表,归表。(4)分析资料统计分析包括统计描述和统计推断(参数估计,假设检验)。

2、计量资料中,集中趋势和离散趋势分别包括

集中趋势:算术均数、几何均数、中位数、百分位数 离散趋势:极差(全距)、四分位数间距、方差(总体方差和样本方差)、标准差和变异系数。

第二章

1、试述频数分布表的用途 (1)描述频数分布的类型,(2)描述频数分布的特征,(3)便于发现一些特大或特小的离群值,(4)便于进一步做统计分析和处理

2、频数表的步骤 (1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距=R/组段数,但一般取一方便计算的数字;(4)列出各个组段并确定每一组段频数。

3、试述正态分布、标准正态分布及对数分布的联系和区别

(1)原始值X:正态分布无需转换,标正分布作u=(X-μ)∕σ转换,对数正态分布作Y=lgX转换。

(2)分布类型:正态分布对称,标正分布对称,对正分布正偏态 (3)集中趋势指标:正态分布μ,标正分布μ=0,对正分布G

(4)均数与中位数的关系:正态分布μ=M,标正分布μ=M,对正分布μ﹥M

4、正态分布的面积规律

(1)X轴与正态曲线所夹面积恒等于1或100% (2)区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95%,区间μ±2.58σ的面积为99%

5、极差、四分位数间距、标准差及变异系数的适用范围

这四个指标均反映计量资料的离散程度。极差与四分位数间距可用于任何分布,后者较前者稳定,但均不能综合反映各观察值的变异程度;标准差最为常用,要求资料近似服从正态分布;变异系数可用于多组资料 见度量衡单位不同或均数相差悬殊时的变异程度比较。

6、医学参考值范围的含义、确定的原则和方法

医学中常把绝大多数正常人的某项指标范围称为该指标的参考值范围。所谓“正常人”不是指完全健康的人,而是指排除了所研究指标的疾病和有关因素的同质人群。

确定参考值范围的原则和方法是:(1)定义“正常人”,不同指标“正常人”的定义也不同;(2)选定足够数量的正常人作为研究对象;(3)用统一和准确的方法测定相应的指标;(4)根据不同的用途选定适当的百分界限,常用95%;(5)根据此指标的实际意义,决定用单侧范围还是双侧范围;(6)根据此指标的分布决定计算方法 ,常用的计算方法有:正态分布法和百分位数法。

第三章

1、标准差与标准误是区别与联系

区别:(1)含义不同:标准差S表示观察值的变异程度,描述个体变量值(x)之间的变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。标准误估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。(2)与n的关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。(3)用途不同:标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。

联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。

标准差: 标准误:

2、t分布与u分布的异同

相同点:t分布和标准正态分布(u分布)都是以0为中心的正态分布。标准正态分布是t分布的特例(自由度是无限大时)。

不同点:t分布为抽样分布,u分布为理论分布;t分布比标准正态分布的峰值低,且尾部翘得更高;t分布受自由度大小的影响,随着自由度的增大,逐渐趋近于标准正态分布;t分布有无数条曲线,而u分布只有唯一一条曲线。

3、对两指标进行比较,是否必须做假设检验

(1)如果是由随机抽样资料计算得到的指标,在比较时应做统计推断。因为此时存在抽样误差,直接由两样本统计量的大小比较结果对总体情况下结论是不合适的。如果是由总体数据计算得到的指标进行比较,可以不必进行假设检验。 (2)统计推断的方法包括参数估计和假设检验,对两指标进行比较可以选择其中的任一方法进行。参数的可信区间不仅能够进行指标大小的比较,还可以提示两指标的差别有无实际的专业意义,但其职能在预先规定的概率,即可信度(1-α)的前提下进行计算,而假设检验可以获得一个较为确切的概率P值。

4、如何合理设置检验水准α

(1)α值是在科研设计(调查设计或实验设计)中根据研究目的预先确定的,不应在算出P值之后再来选择。 (2)若假设检验的重点是减少I型错误(如一般的假设检验),一般取α=0.005;若中的年是减少II型错误(如方差齐性检验、正态性检验等),一般取α=0.10或α=0.020,甚至更高。

5、假设检验中α和P的区别

α和P均为概率,其中是指拒绝了实际上成立的H0所犯错误的概率,是进行统计推断时预先设定的一个小概率事件标准,P值是由实际样本获得的,在H0成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量的概率。在假设检验中通常是将P与α对比来得到结论,若P≤α,则拒绝H0,接受H1,有统计学意义,可以认为?不同或不等,否则,若P>α,则不拒绝H0,无统计学意义。尚不能认为?不同或不等。

6、怎样正确选择单侧检验和双侧检验

单双侧检验首先应根据专业知识来确定,同时也应考虑所要解决问题的目的。若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验。在尚不能从专业知识判断两种结果谁高谁低时,用双侧检验。若研究者对于低于或高于两种结果都关心,则用双侧检验;若仅关心其中一种可能,则取单侧检验。一般认为双侧检验较保守和稳妥,单侧检验由于充分利用了另一侧的不可能,故更易得出有差别的结论,但应慎用。

7、假设检验中如何确定P值?简述P值的含义。

求出检验统计量后,可通过统计用表直接查出P值。P值是指从H0所规定的总体中做随机抽样,获得等于及大于(或等于及小于)现有样本获得的检验统计量的概率。

8、什么是两类统计学错误?二者有何联系?

由于样本的随机性,假设检验中作出的结论可能会犯两类不同类型的错误:I型错误和II型错误。I型错误是拒绝了实际上成立的H0,即“弃真”;II型错误是不拒绝实际上不成立的H0,即“存伪”。理论上犯第一类错误的概率为α,假设检验时可根据研究者的要求来确定;犯第二类错误的概率为β,它只有与特定的H1结合起来才有意义。β值的大小很难确切地估计,但知道在样本含量不变的前提下,α越小,β越大,反之,α越大,β越小。同时减少α和β的唯一方法是增加样本含量,因为增加了样本含量后,均数的抽样误差小,样本均数的代表性强,也就是样本均数较接近总体均数,因而可使犯第一类错误和第二类错误的概率同时减少。(1-β)称为检验效能或把握度。

9、P﹤0.05,拒绝H0的理论依据

P值是指从H0规定的总体随机抽样得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如t或u)的概率。当P﹤0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于通常确定的小概率事件标准0.05.因小概率事件在一次试验中几乎不可能发生,现的确发生了,说明现有样本信息不支持H0,所以怀疑原假设H0不成立,故拒绝H0。在下“有差别”的结论的同时,我们能够知道可能犯I型错误的概率不会大于0.05(即通常的检验水准),这在概率上有了保证。

10、t检验的应用条件

对单样本t检验要求资料服从正态分布;对配对t检验要求差值服从正态分布;

对两样本T检验要求两组数据均服从正态分布,且两样本对于的两总体方差相等,对两小样本尤其要求方差齐性。

11、t检验的注意事项

(1)要有严密的抽样设计,随机、均衡、可比。(2)选用的检验方法必须符合其适用条件(注意:t检验的前提是资料服从正态分布)。(3)单侧检验和双侧检验,单侧检验的界值小于双侧检验的界值,因此更容易拒绝,犯第Ⅰ错误的可能性大。(4)假设检验的结论不能绝对化。不能拒绝H0,有可能是样本数量不够,拒绝H0,有可能犯第Ⅰ类错误。(5)正确理解P值与差别有无统计学意义。P越小,不是说明实际差别越大,而是说越有理由拒绝H0,越有理由说明两者有差异,差别有无统计学意义和有无专业上的实际意义并不完全相同。(6)假设检验和可信区间的关系。结论具有一致性,提供的信息不同。区间估计给出总体均值可能取值范围,但不给出确切的概率值,假设检验可以给出H0成立与否的概率。

12、假设检验时应注意的事项

(1)要有严密的抽样研究设计;样本必须是从同质总体中随机抽取的,要保证组间的均衡性和资料的可比性,可能影响结果的非处理因素在对比组间应尽可能相同或相近;(2)正确选择检验方法;根据现有的资料类型、设计类型、分析目的、样本含量等因素选用适当的检验方法,如不符合条件可做适当转换;(3)正确理解“差别无显著性”的含义,差别有统计学意义,不能理解为两者差差大,也不能理解为所分析的指标在实际应用上就有“显著效果”。(4)检验假设的推断结论为概率结论,不能绝对化:检验水准人为规定,是相对的,报告结论时应列出检验统计量和P值的确切范围。(5)注意是单侧检验还是双侧检验

13、假设检验的步骤

(1)建立假设和确定检验水准:根据实际情况确定单、双侧检验,建立假设,确定检验水准;(2)选定检验方法和计算统计量:根据设计的类型及研究目的选择合适的检验方法并计算出对应的统计量;(3)确定P值并做出推断结论。若t≥tα,v,则P≤α,按检验水准,拒绝H0,接受H1,尚可认为差异显著有统计学意义;相反则差异不显著,无统计学意义。

14、可信区间与参考值范围的区别 意义、计算公式和用途均不同。(1)参考值范围是指同质总体内包括百分之几十个体值的估计范围。而可信区间是指在百分之几十的可信度估计的总体参数的所在范围。(2)同样的百分之几十,参考值范围是样本范围,可信区间是指可信度范围,二者有着本质的不同。(3)从意义来看,95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指按95%可信度估计的总体均数的所在范围。(4)从计算公式看,若指标服从正态分布,95%参考值范围的公式是:±1.96s。总体均数95%可信区间的公式是:。前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。(5)从用途上看,可信区间用来估计总体均数,参考值范围用来判断观察对象的某项指标是否正常。

搜索更多关于: 统计简答 的文档
  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

第一章 1、医学统计工作的步骤 (1)设计;(2)搜集资料;来源:医学领域的统计资料主要来自三个方面,统计报表,经常性工作记录,专题调查或专题实验;要求:统计学对原始资料的要求是完整、准确、及时;贮存:注意资料的时效性、磁盘备份等。(3)整理资料:检查核对准确性和完整性,设计分组,拟定整理表,归表。(4)分析资料统计分析包括统计描述和统计推断(参数估计,假设检验)。 2、计量资料中,集中趋势和离散趋势分别包括 集中趋势:算术均数、几何均数、中位数、百分位数 离散趋势:极差(全距)、四分位数间距、方差(总体方差和样本方差)、标准差和变异系数。 第二章 1、试述频数分布表的用途 (1)描述频数分布的类型,(2)描述频数分布的特征,(3)便于发现一些特大或特小的离群值,(4)便于进一步做统计分析和处理

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com