云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > 假设检验

假设检验

  • 62 次阅读
  • 3 次下载
  • 2025/5/30 17:18:28

较合适,使用左侧检验。对于第三种情形,备选假设是总体均值大于一个确定的?0,检验统计量在极端小的左侧取值时,对备选假设是不利的。因此拒绝原假设的拒绝域被安排在左侧,而使用单侧检验中的右侧检验。最后我们可以归纳结论是:用单侧检验还是双侧检验,使用左侧检验还是右侧检验,决定于备选假设中的不等式形式与方向。与“不相等”对应的是双侧检验,与“小于”相对应的是左侧检验,与“大于”相对应的是右侧检验。

二、总体平均数的检验

(一)先考虑总体标准差σ已知的情形

在例5-1中,设按历史资料,总体的标准差是4毫升。我们通过检验总体均值是否等于250毫升,来判断饮料厂商是否欺骗了消费者。程序如下:

第一步:确定原假设与备选假设。

:=250,1:<250

以上的备选假设是总体均值小于250毫升,因为消费者协会希望通过样本数据推断出厂商的欺骗行为(大于250毫升一般不会发生)。因此使用左侧检验。

第二步:构造出检验统计量。

我们知道,如果总体的标准差已知,则正态总体(正常情况下,生产饮料的容量服从正

0

H?H?态分布)的抽样平均数,也服从正态分布,对它进行标准化变换,可得到:

z?X??0(5.2)

可用z作为检验统计量。

第三步:确定显著性水平,确定拒绝域。

显著水平由实际问题确定,我们这里取α=0.05,使用左侧检验,拒绝域在左边,查标准正态分布表得临界值:-?=-1.645,拒绝域是z<-1.645。

第四步:计算检验统计量的数值。

样本平均数X?248,n=50,代入检验统计量得:

z?X??0248?250450z?n~N?0,1?????3.54??1.645n

第五步:判断。

检验统计量的样本取值落入拒绝域。拒绝原假设,接受备选假设,认为有足够的证据说明该种纸包饮料的平均容量小于包装盒上注明的250毫升,厂商有欺骗行为。

(二)总体标准差未知的情形

我们在区间估计时已知,当总体的标准差或方差未知时可相应地用样本的标准差与方差代替它们。但这时检验统计量不服从标准正态分布了。事实上这时的检验统计量是:

t?X??0sn~t(n?1) (5.3)

式中S是样本标准差,检验统计量服从的是自由度为n-1的t分布。这里用t作为检验总体均值的统计量,称之为t-检验统计量(t-test statistic)。但是,在大样本场合(样本容量n大于30时),t-统计量与标准正态分布统计量近似,通常用z检验代替t检验。

【例5-3】某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克,某日随机抽查9包,测得样本平均重量为986克,样本标准差是24克。试问在α=0.05的显著性水平上,能否认为这天自动包装机工作正常?

解:第一步:确定原假设与备选假设。

H

0

?=1000,

H1:

??1000

以上的备选假设是总体均值不等于1000克,因为只要均值偏离1000克,都说明包装机工作不正常。因此使用双侧检验。 第二步:构造出检验统计量。

由于总体标准差未知,用样本标准差代替,相应检验统计量是t-统计量: 第三步:确定显著性水平,确定拒绝域。 α=0.05,查t-分布表(自由度n-1=8),得临界值是2.306 。

第四步:计算检验统计量的数值。

X??0sn986?1000249t?2?n?1??t0.025?8?=2.306,拒绝域是

t?样本平均数x?986,n=9,s=24,代入t-检验统计量得:

t????1.75

H

第五步:判断。

由于2.306,检验统计量的样本取值落入接受区域,所以接受0。样本数据说明这

天的自动包装机工作正常。

我们不难发现,t-检验与正态检验十分相似,不同之处只是在确定临界值时,查的分布表不同,而且,在大样本场合两者检验过程可完全相同。

三、总体成数的检验

由前章的抽样分布我们知道,样本成数是一个特殊的平均数,当样本容量较大时,下列统计量服从标准正态分布:

z?P?pp?1?p?nt? (5.4)

上式中,小写字母p代表总体的成数,大写字母P代表样本的成数。 以上的z统计量可以用作总体成数检验的检验统计量。

【例5-4】某企业声明有30%以上的消费者对其产品质量满意。如果随机调查600名消费者,表示对该企业产品满意的有220人。试在显著性水平α=0.05下,检验调查结果是否支持企业的自我声明。

解:第一步:作出假设。

:p =30%,1:30%。

以上的备选假设是企业自我声明的结论,我们希望该企业说的是实话。因此使用右侧检

0

HHp?验。

第二步:构造z检验统计量。 第三步:确定拒绝域。

显著水平α=0.05,查标准正态分布表得临界值:?=1.645,拒绝域是z>1.645。 第四步:计算检验统计量的数值。

样本成数p=220/600=0.37,总体假设的成数P=0.3,代入z检验统计量得:

z?P?pp?1?p?n?0.37?0.30.3?1?0.3?/600?3.5z

第五步:判断。

检验统计量的样本取值z=3.5>1.645,落入拒绝域。拒绝原假设,接受备选假设,认为样本数据证明该企业声明属实。

四、p-值检验

p-值检验是国际上流行的检验格式。该检验格式是通过计算p-值,再将它与显著性水平α作比较,决定拒绝还是接受原假设。所谓p-值就是拒绝原假设所需的最低显著性水平。p-值判断的原则是:如果p-值小于给定的显著性水平α,则拒绝原假设;否则,接受原假设。或者,更加直观的原则是:如果p-值很小,拒绝0,p-值很大,接受0。p-值检验无需针对不同的显著性水平,先查分布表确定临界值,然后才能进行检验判断。p-值检验可直接把计算机计算出来的p-值与显著性水平进行比较,立刻作出统计决策。Excel等统计分析软件都直接给出了p-值。请大家注意的是这里的p-值是指概率,不要与前面的成数指标相混淆。

p-值实际上是检验统计量超过(大于或小于)由样本数据所得数值的概率。因此,p-值与检验统计量的分布、是双侧检验还是单侧检验、是左侧还是右侧检验都有关系。

(一)z检验的p-值

z检验统计量服从正态分布,可利用标准正态分布表计算p-值。先看总体的均值检验的p-值计算公式,以

如果如果

H1H1Hz0H

H

表示检验统计量的抽样数据,则p-值的计算方法如下: ,p-值=2,p-值=

p?z?z0::

???0???0???? (5.5) (5.6)

p?z?z0?p?z?z

00如果1:,p-值= (5.7)

总体成数检验的p-值计算公式,与上述三式完全相同,只需将总体均值换成总体成数就行了。

?【例5-5】利用p-值检验重新检验例5-1。

解:第一、第二步与例5-1完全相同,故省略之。 第三步:计算样本统计的数值。

样本平均数X?248,n=50,代入检验统计量得:

z0?X??0248?250450p?z?z0?1????3.54n第四步:计算p-值。 使用左侧检验,p-值=

1

。查标准正态分布表得:

p-值=2[1-F(3.54)] =2(1-0.999 8) =0.000 1 第五步:判断。

p-值小于给出的显著性水平(0.05),拒绝原假设,接受备选假设,与例5-1的结论相同。 【例5-6】某国总统选举中,有位候选人几个月前的支持率是60%。近期的一项调查,访问了500人,发现他的支持率变成了55%。显著性水平取0.05,试用p-值方法,检验他的支持率是否下降了?

解:第一步:确定原假设与备选假设。

:P=60%,1:P?60%。 第二步:构造检验统计量。

第三步:计算检验统计量的数值。

0

HHP=55%,代入检验统计量中,得:

z0?P?pp?1?p?n?0.55?0.60.6??1?0.6?500=-2.28

第四步:计算p-值。

由于是左侧检验,p-值计算为:

0p-值==第五步:判断。

p?z?z?p?z??2.28?=0.0113

p-值小于显著性水平0.05,拒绝原假设,接受备选假设,有足够的证据证明该候选人的支持率已经下降了。

(二)t检验的p-值

进行t-检验时,p-值的计算与z检验的p-值计算方法相同,两者的区别在于:进行t-检验其p-值不是查标准正态分布表,而是查t-分布表,自由度是n-1。在大样本场合,这个差别都可以不存在,因为这时t-分布与标准正态分布近似。由中心极限定理我们还可知道,在大样本场合,检验统计的分布还不受总体分布的正态性限制。

我们可以归纳p-值检验的步骤如下:(1)建立原假设与备选假设;(2)确定检验统计量及其分布;(3)将样本观测值代入检验统计量计算出其样本数值;(4)计算p-值;(5)将p-值与显著性水平α相比较,作出判断。

第三节非参数检验

一、自由分布检验概述

第二节介绍的统计检验属于参数假设检验,都是先对样本所属总体的性质作出若干的假定,或对总体的分布形状加以限定,然后对总体的有关参数情况进行统计假设检验。因此,参数检验又称为限定分布检验。自由分布检验与限定分布检验不同,它是指在假设检验时不对总体分布的形状加以限制的检验。与参数检验相对应,自由分布检验又称为非参数检验,但这里的非参数并不是指“不含参数或没有参数”。

自由分布检验对比参数检验,具有以下优点:

首先,检验条件比较宽松,适应性强。自由分布检验对资料的要求不像参数检验那样严格,它适合于处理诸如非正态的、方差不等的或分布形状未知的资料。

其次,自由分布检验的方法比较灵活,用途广泛。它不但可以应用于处理测量层次较高的定距、定比数据,也适用于处理层次较低的定类、定序数据。对于那些不能进行加、减、乘、除运算的定类数据与定序数据,可使用符号检验、秩和检验等方法进行检验。

再次,自由分布检验的计算相对简单。由于自由分布的检验方法不用复杂计算,一般使用计数方法就可以了,它的计数过程与结果都比较简单、直观与明显。

自由分布检验由于其要求的条件简单,由此产生的缺点也是明显的。由于它对原始数据中包含的信息利用得不够充分,检验的功效相对较弱。当总体的分布形式已知时,基于这种分布类型的参数方法,一般说来比非参数方法为佳。例如,对于一批资料,可同时适用于参数的t-检验、非参数的符秩检验和符号检验。其检验功效是,t-检验的最好,符秩检验次之,符号检验最差。这主要是由于符号检验对信息的利用最不充分。所以参数检验与自由分布检验是针对不同情况提出的两种统计方法,它们各有优缺点,可以互为补充。

下面简单介绍几种最常用的自由分布检验方法。

二、符号检验

符号检验虽然是自由分布检验中最简单的一种检验方法,但是这种方法却经常得到使用。该方法是建立在以正、负号表示样本数据与假设参数值差异关系基础上的,因此称之为符号检验。该方法既适用于单样本场合,也适用于配对样本场合。

搜索更多关于: 假设检验 的文档
  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

较合适,使用左侧检验。对于第三种情形,备选假设是总体均值大于一个确定的?0,检验统计量在极端小的左侧取值时,对备选假设是不利的。因此拒绝原假设的拒绝域被安排在左侧,而使用单侧检验中的右侧检验。最后我们可以归纳结论是:用单侧检验还是双侧检验,使用左侧检验还是右侧检验,决定于备选假设中的不等式形式与方向。与“不相等”对应的是双侧检验,与“小于”相对应的是左侧检验,与“大于”相对应的是右侧检验。 二、总体平均数的检验 (一)先考虑总体标准差σ已知的情形 在例5-1中,设按历史资料,总体的标准差是4毫升。我们通过检验总体均值是否等于250毫升,来判断饮料厂商是否欺骗了消费者。程序如下: 第一步:确定原假设与备选假设。 :=250,1:<250 以上的备选假设是总体均值小于250毫升,因为消费者协会希望通过样本

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com