当前位置:首页 > 第三篇 抽样调查
(一)抽样误差概率度的含义
抽样极限误差的实际意义是期望总体指标被包含在以样本指标为中心,长度为2?的区间内。不过,我们并没有百分之百的把握肯定该区间包含总体指标。比如,例1中平均利润的推算,全部旧车的平均利润被包含在2300元—2500元之间并不是必然事件。那么,总体指标被包含在该区间内的把握程度有多大?这要取决于区间的长度,即极限误差?的大小。极限误差越大,区间越宽,把握程度就越高。所以,总体指标包含在该区间的把握程度问题,实质上就是一定的极限误差对应的概率保证程度问题。
抽样极限误差与抽样平均误差之比,叫做抽样误差的概率度,用t表示。抽样极限误差与抽样平均误差的比值大小能反映估计区间的宽窄,标志着概率保证程度的高低,故称概率度。其计算公式为:
t???
在标准正态分布中,概率保证程度F(t)是概率度t的函数,t值一定,F(t)也随之确定,t值越大,F(t)也越大,其值一一对应(见本书附表:正态分布概率表)。最常用的对应值如表3—8—1所示。
表3—8—1 正态分布概率简表 t F(t) 0.6827 0.9500 0.9545 0.9973 1 1.96 2 3 例3,根据例1中平均利润推算的资料,求平均误差不超过100元,亦即全部旧车的平均利润包含在(2300元,2500元)内的概率是多少?
已知:?x=100元,前已算出?x=84.85元 所以,概率度t=
?x?x=
10084.58≈1.18
查正态概率表得F(t)=76.2%
例4,根据例2出口布鞋品质检验资料,全部布鞋合格率在98%—100%之间的概率是多少? 已知:?P=1%,前已计算出?p?0.99% 所以,概率度t=
?p?P=
1%0.99%≈1.01
13
查表得:F(t)=68.75%
(二)抽样误差概率度与抽样极限误差之间的推算
在抽样推断中,有时是事先对推算结果的精确度做了要求,即确定了抽样极限误差,这就需要根据既定的抽样极限误差来确定相应的概率保证程度;而有时是预先对推断的可靠性做了要求,即确定了概率保证程度,为了估计出总体指标的区间范围,就需要推算抽样极限误差。其方法是:先根据既定的概率保证程度F(t) 查正态分布概率表,得到相应的概率度t,再按下式进行推算:
∵ t???
∴ ??t?
例5,商检机构在对某公司出口的袋装食品进行检验时随机抽检100袋,测得其平均重量为100.5克,标准差为4克,重量不足100克(不合格)的有10袋。问在95.45%的概率保证程度下,平均重量及合格率的最大允许误差为多少?若将概率保证程度提高到99.73%,极限误差又各为多少?
平均重量的抽样平均误差:
?x??2Xn?42100n1n=0.4(克)
100?10100样本合格率p?==90%
合格率的抽样平均误差:
?p?p?1?p?n?90%??1?90%?100=3%
(1) 概率保证程度为95.45%时,t=2 平均重量的极限误差:
?x?t?x=2×0.4=0.8(克)
合格率的极限误差:
?p?t?p=2×3%=6%
(2) 概率保证程度为99.73%时,t=3 平均重量的极限误差:
14
?x?t?x=3×0.4=1.2(克)
合格率的极限误差:
?p?t?p=3×3%=9%
第三节 抽样估计
抽样估计就是根据样本指标数值及抽样误差对总体指标数值做出估计和推断。 一、抽样估计的主要特点 (一)抽样估计是一种归纳推理
逻辑推理包括演绎推理和归纳推理两种。演绎推理是从一般到特殊的推理方法,即从一般认识导出特殊结论,只要前提为真,其结论就一定正确。而归纳推理是从具体到一般的逻辑推理方法,结论也不一定正确。抽样估计是根据对样本的认识去推断总体特征,因而属于归纳推理,其推断结果是一个可能结果,不一定绝对正确。
(二)抽样估计是不确定性的概率估计
由于样本指标与总体指标之间并不存在严格的数量依存关系,所以不可能借助一个确定的函数关系式将样本指标数值代入,来求得总体指标数值,只能根据样本指标去推算总体指标的可能范围。但是,抽样估计能够运用概率论的原理,在做出这种可能推断时确定出相应的概率保证程度,即抽样估计结论的不确定性是可以估计的。
(三)抽样估计的精确度与可靠性是矛盾的
抽样估计必定产生抽样误差。允许误差的大小标志着推断估计结果的精确度高低,与推算的可靠程度之间存在这样的关系:允许误差越大,即推断的精确度越低,则推断的可靠程度就越高;允许误差越小,即推断的精确度越高,则推断的可靠程度就越低。如果我们不允许有误差,就只好把样本指标值作为总体指标值,但这种估计的可靠性几乎为零。因此,抽样估计的精确度与可靠性是一对矛盾,应根据研究目的妥善解决。
二、优良估计量的标准
在对某一总体指标进行抽样估计时,可以用作估计量的指标可能不止一个。那么,用哪个指标做总体的估计量效果最好呢?作为一个优良的估计量,通常应符合以下三个标准:
(一)无偏性
无偏性是指用作估计量的指标平均值应等于被估计的总体指标值,即在依据该估计量推
15
算总体指标时,平均来讲没有偏误。
(二)一致性
一致性是指随着样本容量的不断增大,作为估计量的指标值也应不断地趋近被估计的总体指标值。
(三)有效性
有效性是指为使推断结果的误差最小,作为估计量的指标的离散程度应是最小的,即估计量的方差(或标准差)应最小。
数理统计中已经证明:
1.样本平均数的平均数等于总体平均数,即x?X;样本成数的平均数等于总体成数,即p?P。
2.随着样本容量的无限增大,样本指标与总体指标之间的绝对离差任意小的可能性趋于必然。即对任意小的正数?,limPx?X???1。
n????3.样本指标的方差是最小的
所以,用样本指标作为总体指标的估计量是符合上述标准的。也就是说,样本指标是总体指标的优良估计量。这就是我们通常用样本指标去估计总体指标的理由。
三、抽样估计的方法
抽样估计的方法有两种,即点估计和区间估计。 (一)点估计
点估计就是直接用样本指标数值作为总体指标的估计值。即不考虑抽样误差和可靠程度,直接把样本平均数作为总体平均数的点估计值,把样本成数作为总体成数的点估计值。在此基础上,还可进一步推算总体的总量指标。尽管这种方法不够严密,但简单实用,因而在统计实践中也有较多的应用。
运用点估计法对总体总量指标进行推算主要有直接换算法和修正系数法,现分述如下: 1.直接换算法
直接换算法是把样本指标值x或p作为总体指标的估计值,再乘以总体单位数来推算总体总量指标的方法。
例如,某公司考虑购买一批减价商品,这批商品共2000件,其中有些是次品,但不知次品数或次品率是多少。公司得知每件次品的修复成本为0.25元,若总的修复成本低于50元,
16
共分享92篇相关文档