云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > 抽样区间估计与本容量计算释疑

抽样区间估计与本容量计算释疑

  • 62 次阅读
  • 3 次下载
  • 2025/6/14 22:34:27

抽样区间估计与样本容量计算释疑

抽样推断是统计学的基本方法之一,也是统计学原理的重点学习内容之一。抽样调查特点、抽样平均误差影响因素、抽样参数估计、抽样样本容量确定等构成了这一章的重点内容,而其中的参数估计与样本容量确定则是计算的重点。本文拟通过案例与初学者谈谈如何进行抽样估计,如何确定样本容量。

[例1]某市统计部门为了解全市居民年消费支出情况,从全市20万户居民中随机抽取1000户居民进行调查,经计算平均每户年生活费支出为1.8万元,标准差0.9万元。

要求:⑴以95.45%(t=2)的概率保证程度估计户均生活费支出的区间。

⑵估计全市居民消费总支出区间。

x?1.8,??0.9,t?2,N?200000,n?1000?2n0.81平均误差?x?(1?)?(1?0.5%)?0.028万元nN1000[解题过程]已知

极限误差?x?t?x?2?0.028?0.056万元 户均年支出区间:[1.8-0.056,1.8+0.056]万元=[1.744,1.856]万元 全市居民消费总支出区间:20万户×[1.744,1.856]万元=[3.488,3.712]亿元

[几点说明](1)一般而言,抽样区间估计的基本步骤是:点估计、平均误差、极限误差、置信区间。本例就是标准的均值参数区间估计题型。由于样本均值与标准差是已知的,所以无需计算点估计值。(2)本题计算时,必须注意“方差”与“标准差”的区别,不要将标准差当作方差来使用。(3)社会经济问题抽样调查一般都是采用不重复抽样的,只有当总体单位总数N未知或n/N的比重很低时,才可以采用重复抽样平均误差公式来计算平均误差。(4)估计总量指标时,可直接将样本均值的区间乘上全及总体单位总数N即可。

[例2]某企业为了解本市居民对某类保健品的看法,采用简单随机抽样方式,从全市居民户中随机抽取500人进行调查结果如下:

对该类保健品的态度 喜欢 一般性 不喜欢 合计 人数 320 100 80 500 要求:以95%的可靠性估计全市居民中“喜欢”该产品的比率(t=1.96)。

n?500,t?1.96,n1?320点估计p?n1/n?320/500?64%[解题过程]已知

极限误差?p?t?p?1.96?0.0215?4.21%平均误差?p?p(1?p)?n0.64?0.36?0.021466?2.15P0 喜欢该类保健品者的比率置信区间为:

[64%-4.21%,64%+4.21%]=[59.79%,68.21%]

[几点说明](1)本例是标准的成数区间估计题型。其基本步骤同样是:点估计、平均误差、极限误差、置信区间。(2)成数区间估计时最容易犯的错误就是:将N、n、n1相混淆。其实,若用文字表述,应该是“从N中随机抽取n个单位进行观察,有n1个单位是(具有某种特征)……”。并且,不要将抽样估计中提供的“可靠性水平”当作公式中的P来使用。“可靠性水平”值在计算时没有其它

用途,只告诉我们概率密度t的具体取值。(3)本例没有提供全市居民总人数,所以N可视作“无穷大”。所以采用重复抽样的平均误差公式计算抽样误差。 [例3]某企业拟采用抽样技术对当天生产的5000件电子产品的耐用时间进行测试,要求有99%的可靠性(t=2.58)使耐用时间的误差范围不超过20小时。根据生产规格要求,这类电子产品耐用时数的标准差不超过150小时。问:至少应该抽取多少件产品进行质量检查(分别重复抽样与不重复抽样两种情况)。

Nt2?2t2?22.582?1502不重复抽样时的样本容量n?重复抽样时的样本容量n?2??374.4?375?件?2N?2x?t2?2?x205000?2.582?1502??348.3?349?件?5000?202?2.582?1502 [解题过程]已知N=5000,t=2.58,Δx=20,σ=150

[几点说明](1)本例是样本容量确定的标准题型之一。样本容量确定其实是极限误差计算(参数估计)的反问题,因此其公式就是根据极限误差与平均误差之间的关系推导而来的。因为Δx=tμx,等式两边平方,即有Δx2=t2μx2,在简单随机抽样情况之下,Δx2=t2σ2/n ,从而有上述的公式。(2)对于成数的抽样估计,是非标志的方差σp2=P(1-P),故只要将上述公式中的方差改为P(1-P)即可。(3)样本容量估计时,计算结果总是取整数,小数点无论是否达到0.5均应该进位,故本列中374.4与348.3均进位,分别成为375与349。(4)在样本容量确定时,允许误差或误差范围均是指极限误差Δ。

[例4]某市质量技术监督部门拟对市场上某类牛奶制品的质量(合格率)进行检查,要求在95%的可靠性之下(t=1.96),合格率的误差范围不超过1%。根据最近三次同类检查,这类产品的合格率分别为98.9%、98.2%、97.8%。问至少应该抽多少件产品进行检验?若允许误差扩大1倍,则应该抽取多少件进行检验?

t2P(1?P)1.962?0.978?0.022样本容量n???826.6?827?件?22?p0.01 [解题过程]已知t=1.96,Δp=1%,P=97.8%

t2P(1?P)1.962?0.978?0.022n???206.7?207?件?22?p0.02当允许误差扩大1倍时,即Δp=2%,于是样本容量:

[几点说明](1)本例是成数估计时的样本容量确定。虽然实际的质量检验肯定是采用不重复抽样的,但由于市场上该类产品数量未知,可视作无穷大,故采用重复抽样的样本容量公式。(2)本例的关键是公式中P的选择。题中提供了三次同类检查的合格率资料,但一般不能用三者平均数作为P。样本容量确定时通常采取“保守原则”,因此应该取“最大方差”,题中提供的三次调查合格率,其方差分别为98.9%(1-98.9%)=0.010879、98.2%(1-98.2%)=0.011784、97.8%(1-97.8%)=0.021516,故取P=97.8%时方差达到最大,据之计算得出的样本容量也最大,据之作出的调查估计也是“最保守”从而也是最可靠的。(3)但必须注意的是,此例表面上看是取三个合格率的最小者作为P,但切不可据之类推,以为永远是最小的那个比率。例如,本例若改为对“不合格率“的估计,则前三次调查的不合格率是1.1%、1.8%、2.2%,若错误地认为应该取三者中的小者,就会取P=1.1%,但据之计算的方差却不是最大而是最小。此时取P=2.2%才可达到“方差最大”。其实,P=50%时成数方差达到最大值,因此,应该取最接近50%的那个比率作为样本容量公式中的P。(4)对于例3资料,其实也存在着“最大方差”原则问题,即当资料中给出了近几次类似调查的样本方差,则也应该取其中最大者作为公式中的方差σ。(5)当同一次调查需要对两个以上的项目(如平均值与成数)进行估计时,应该分别计算这些项目的必要样本容量,然后取其中之大者作为最终确定的抽样单位数。

[例5]对于简单随机重复抽样,在其它条件不变的情况之下,(1)抽样单位数(样本容量)分别增加1倍、3倍、减少25%、50%,则抽样平均误差分别如何变化;(2)反之,若抽样允许误差缩小20%、50%、扩大50%、100%,则抽样单位数(样本容量)应该如何变化?

[解题过程](1)设改变要求之前的样本容量为n旧,平均误差记为μ旧,则当样本容量分别增加1倍、3倍、减少25%、50%时,相应的n将分别为:

2n=2n旧、n=4n旧、n=0.75n旧、n=0.5n旧,相应抽样平均误差分别为:

???2n??22n旧?1?2n旧?0.7071?旧

即样本容量扩大一倍,平均误差减少29.29%。

???2n??24n旧1?2??0.5?旧2n旧10.75???2n??20.75n旧??2n旧?1.1547?旧0.5n旧 即样本容量扩大3倍,抽样平均误差减少50%。

即样本容量减少25%,抽样平均误差扩大15.47%。 即样本容量减少50%,抽样平均误差扩大41.42%。

(2)设改变要求之前的允许误差记为Δ旧,相应的样本容量记为n旧,则当抽样允许误差缩小20%、50%、扩大50%、100%,时,相应的Δ分别为:

???2n??20.5n旧?1?2?1.4142?旧t2?2t2?2n?2??1.5625n旧2??0.8?旧?Δ=0.8Δ旧,Δ=0.5Δ旧,Δ=1.5Δ旧,Δ=2Δ旧,,相应样本容量为:

即允许误差减少20%,样本单位数应该扩大0.5625倍。

t2?2t2?2n?2??4n旧2??0.5?旧?t2?2t2?2n?2??0.4444n旧2??1.5?旧?t2?2t2?2n?2??0.25n旧2??2?旧? 即允许误差减少一半,样本单位数应该扩大3倍。

即允许误差扩大50%,样本单位数可以减少55.56%。 即允许误差扩大1倍,样本单位数可以减少75%。 [几点说明](1)本题是测试学生对样本容量与抽样平均误差(或极限误差)之间数量关系掌握的熟练程度。因此,本题关键是搞清楚在重复简单随机抽样情况之下,样本容量与平均误差、极限误差之间的公式关系。(2)本题还必须正确理解统计学中 “扩大了”、“减少了”的真实含义,注意与“扩大到”、“减少到”之间的本质差别。“扩大了一倍”等价于“是原来的二倍”,“减少了20%”等价于“是原来的80%”,貌似简单,却总有不少初学者搞错,因此必须引以重视。

搜索更多关于: 抽样区间估计与本容量计算释疑 的文档
  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

抽样区间估计与样本容量计算释疑 抽样推断是统计学的基本方法之一,也是统计学原理的重点学习内容之一。抽样调查特点、抽样平均误差影响因素、抽样参数估计、抽样样本容量确定等构成了这一章的重点内容,而其中的参数估计与样本容量确定则是计算的重点。本文拟通过案例与初学者谈谈如何进行抽样估计,如何确定样本容量。 [例1]某市统计部门为了解全市居民年消费支出情况,从全市20万户居民中随机抽取1000户居民进行调查,经计算平均每户年生活费支出为1.8万元,标准差0.9万元。 要求:⑴以95.45%(t=2)的概率保证程度估计户均生活费支出的区间。 ⑵估计全市居民消费总支出区间。 x?1.8,??0.9,t?2,N?200000,n?1000?2n0.81平均误差?x?(1?)?(1?0.5

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com