当前位置:首页 > 第1部分 抽样设计
第1部分 抽样设计
第1节 概述
一、作用与特点 1.定义
按照某种随机原则和程序,从总体中抽取一部分单位,通过对这一部分单位进行调查的到的信息,达到对总体情况进行了解或对总体有关情况的估计。
2.作用
(1)数据来源
(2)对已有数据进行调整、验证。 3.特点
(1)节省费用
(2)调查时间短,时效快
(3)有助于提高原始数据的质量
(4)存在抽样误差,但可以计算并控制 二、基本概念 1.总体与样本
总体:调查对象的全体(注意:调查总体与目标总体)
样本:从总体中按一定的原则或程序抽出的部分个体组成的集合 2.总体参数与样本统计量
3.抽样框:供抽样所用的所有调查单位的名单 4.总体分布与抽样分布
(1)总体分布:总体中个元素的观察值所形成的分布 (2)样本分布:样本中观察值所形成的分布 (3)抽样分布:样本统计量的抽样分布
(4)样本均值的抽样分布与总体分布之间的关系: 总体分布 正态分布 非正态分布
大样本 小样本 大样本 小样本 正态分布 正态分布 非正态分布
三、概率抽样与非概率抽样 1.概率抽样:
(1)定义:按照随机原则抽取样本,也称随机抽样。也就是在抽取样本时,排除主观上有意识的挑选,总体中每个单元都有一定的机会被抽中。
(2)分类:等概率抽样和不等概率抽样
(3)特点:可以用样本数据对总体参数进行估计,但操作相对复杂。 2.非概率抽样
(1)定义:根据有关判断有意识的挑选,或者根据方便、快捷的原则抽取。
(2)特点:操作简便,时效快,效率低,但理论上不具备对总体进行推断的依据。
第2节 概率抽样方式
一、简单随机抽样。
1.定义:从总体N个单元中,随机抽取n个单元构成样本 2.放回和不放回简单随机抽样 3.随机化程序实现方法 (1)抽签法 (2)随机数表法 (3)计算机抽取 (4)永久随机数法
4.特点:单元入样概率相同,操作计算简单。 二、分层抽样
1.定义:将总体按照一定的原则分成若干子总体,每个子总体称作层,在每个层内分别抽取样本。
2.原理:先对层进行估计,然后加权汇总。 3.分层原则:层内差异小,层间差异大。 4.特点
(1)能提高估计效率
(2)同时对总体和子总体进行估计 三、整群抽样
1.定义:将总体按照一定原则分成若干群,抽样直接抽取群,对抽中的群进行全面调查。
2.分群原则:群内差异大,群间差异小。 3.特点
(1)实施方便,可节约费用和时间 (2)不需要总体所有单元的名单
(3)如果群内差异小,群间差异大,则估计精度差 四、系统抽样
1.定义:将总体按照某种顺序排列,在规定的范围内随机抽取起始单位,然后按照一定规则确定其他样本单位。(最简单的方法:等距抽样)
2.特点
(1)操作简便;
(2)当N?nk时,样本均值为有偏估计量; (3)方差估计复杂。
3.注意问题:周期性变化的总体 五、多阶段抽样
1.定义:首先从总体中采用随机方法抽取若干个小总体(初级单元),再在抽中的初级单元中随机抽取若干个单元,这种抽样方法称作二阶段抽样。
2.大范围调查中通常采用二阶段抽样的原因
(1)缺少包括所有总体单位的抽样框; (2)可以节省调查的人财物力。 六、其他抽样方法
1.多重抽样(二重抽样、双相抽样) 2.不等概率抽样(pps抽样、?ps抽样) 3.双重抽样框抽样
第3节 非概率抽样方式
一、采用非概率抽样的原因
1.客观条件(调查经费)限制; 2.时间要求紧;
3.调查人员有丰富的积累; 4.不需要进行区间估计。 二、方便抽样
1.定义:按照方便的原则抽取样本,如拦截式调查 2.特点
(1)操作简便,节省经费;
(2)不能用于样本推断总体,不适合于描述性研究和因果关系研究,但适合于探索性研究。
三、判断抽样‘
1.定义:抽取样本时,由调查人员依据对实际情况了解和经验,人为确定样本单位,或有了解情况的专家圈定样本。
2.类型:平均型、众数型、特殊型(典型调查) 3.特点
(1)简便、快捷、节省费用,符合调查目的和特殊需要; (2)可以了解总体的数量特征和对问题深入分析; (3)不能对总体进行参数估计。 四、配额抽样
1.定义:将总体中的各单位按照一定的标准化分为若干个类别,将样本数额分配到个类别中,在规定的数额内,由调查人员任意抽选样本。
2.配额抽样与分层抽样的异同
(1)相同之处:二者都是先将总体分层,然后在各层中抽取样本;
(2)不同之处:配额抽样在各层内采用判断、方便等非概率抽样方式,因此不能对总体进行估计;分层抽样在各层内随机抽取样本,因此可以对总体进行估计。
3.特点:不需要抽样框,又能保证样本结构与总体结构保持一致。 五、自愿样本
1.定义:样本由自愿接受调查的单位所组成。 2.特点
(1)样本集中于某些特定的群体;
(2)样本结构具有独特性,通常与总体结构相去甚远,因而结果不能反映总体情况; (3)组织方便,成本低廉。
第4节 抽样中的误差问题
一、描述误差的概念
1.估计量方差
(1)估计量:设某个总体待估参数为?,在概率抽样条件下,用样本数据计算出一个统计量??作为总体参数?的估计,把??称作?的一个估计量。
?)?E[???E(??)]2 (2)估计量方差:V(?(3)作用:描述估计精度。
2.偏差
?)与(1)定义:如果反复进行抽样,其所有可能样本估计量的均值(数学期望)E(??)?E(??)??。 总体参数的?之间的离差,即Bias(?(2)偏差与估计量方差的区别
1偏差是系统性误差,而估计量方差是随机误差,没有系统性; ○
2估计量方差随着样本量的增大而减小,○而大多数偏差(少数有偏估计量除外)并不随着样本量的增大而减小。
(3)结论
?)?0 1对于无偏估计量B(?○
2采用有偏估计量,无论怎样提高样本量,都不能提高估计精度。 ○
3.均方误差
(1)定义:估计量方差和偏差的平方之和。
?)?E(????)2?E[???E(??)?E(??)??]2MSE(???E(??)]2?[E(??)??]2 ?E[??)?[B(??)]2?V(??)?V(??) (2)对于无偏估计量:MSE(?二、抽样误差
1.定义:由于抽样的随机性产生的,用样本统计量估计总体参数时产生的误差。
?)?V(??)(估计量的标准差,也称抽样标准差) 2.描述方法:S(?3.影响抽样误差的因素
(1)总体的分布状况; (2)样本量;
(3)抽样方式和估计方法。
4.特点:可以计算并控制,但不能消除。 5.控制方法
(1)选择适当的抽样方法; (2)确定充分的样本量;
(3)加强对抽样调查组织的领导,提高抽样调查工作质量。 三、非抽样误差
1.定义:由于抽样框中的单元放回或者遗漏、部分调查对象不回答或者原始数据不准确等原因造成的误差,主要包括抽样框误差、无回答误差、调查员误差、受访者误差等。
共分享92篇相关文档