站内检索:
工业抽样调查基本抽样方法
文章来源:信息处  发布时间:2006-05-08 17:51   字体大小:[ ]
  
    样本抽取即抽样方法是抽样调查理论与方法的核心。在概率抽样中,用样本统计量估计总体参数的方法以及这种估计的精度都与具体抽样方法有关。 

    1  简单随机抽样(simple random sampling)

    简单随机抽样也称为单纯随机抽样。这是一种最基本的抽样方式。设总体的大小为N,从中任意抽取n个单位作为样本,每一个样本都有同样的机会被抽中,这种方法称简单随机抽样,所抽到的样本为简单随机样本。抽取方法可从总体中逐个抽取单位,也可以一次同时从总体中抽得,只要保证全部可能得到的样本每个被抽中的概率都相等。但在具体实施过程中,总是逐个单位抽取的,要求每一个单位有同样的概率被抽中。简单随机抽样可分为重复抽样和不重复抽样两种,重复抽样也称有放回抽样,即在抽取下一个样本单位时,把上一个抽中的单位放回去,因此一个单位有被重复抽中的可能;不重复抽样也称不放回抽样,即抽中的单位不再放回去,因此一个单位只有一次抽中的机会。在社会经济的抽样调查中一般是不重复抽样。

    简单随机抽样是其他抽样方法的基础,因为它在理论上最容易处理,而且若N不太大,实施起来并不困难。但在实际问题中,若N相当大,简单随机抽样就不是很容易就能办到的。首先它要求有一个包含全部个单位的抽样框,其次用这种抽样得到的样本单位较为分散,调查不容易实施。因此在实际中直接采用简单随机抽样的并不多。

    简单随机抽样中的估计方法,通常是采用样本均值(平均数)作为总体均值的估计,用样本比例作为总体比例的估计,这就是简单估计。有时为了提高精度,在有其他辅助变量存在的情况下,也可以用比估计和回归估计等方法。 

    2  分层抽样(stratified sampling)

    将总体按一定的原则分成若干个子总体,每个子总体称为层,在每个层内进行抽样,不同层的抽样相互独立,这样的抽样称为分层抽样。特别是如果每层的抽样都是简单随机抽样,就称为分层随机抽样。在分层抽样中,先根据层样本对层的参数进行估计,然后再将这些层估计加权平均或取总和作为总体均值或总量的估计。

    分层抽样特别适用于既要对总体参数进行估计也需要对子总体(层)参数估计的情形。分层抽样的组织实施也比较方便,样本散布比较均匀,这些都是分层抽样的优点。分层抽样更重要的一个优点是它的精度较高,而且它的数据处理也颇为简单。因此分层技术是应用上最为普遍的抽样技术之一。 

    3  整群抽样(cluster sampling)

    简单随机抽样有样本分散不便于调查,N大时抽样框不容易编制等缺点。整群抽样恰好克服了这些缺点。所谓整群抽样就是先将总体中的各个单位归并成数量较少而规模较大的单位,也称为群。抽样仅对整群,对抽中的群调查其中每一个较小的单位,对没有被抽中的群则不需要进行任何调查。因此整群抽样中的样本单位是以整群形式出现的,故称整群抽样。这里的群也称为初级抽样单位或一级抽样单位(primary sampling unit),群中的小单位称为次级单位或二级单位(secondary sampling unit)。在整群抽样中并不要求提供包含每个次级单位的抽样框,只需要关于初级单位的抽样框即可。另外由于群通常是由那些地理位置邻近的或属同一个系统的单位构成的,整群进行调查将大大便利于实施,节省差旅之类的费用。整群抽样的主要缺点是精度较差,效率不高。这是因为同一群内的单位或多或少有些相似,因此对抽中的群中的每个单位都进行调查也就不可避免地造成浪费。

    目前国家统计局进行的规模以下工业抽样调查,对个体工业采用一阶段或二阶段整群抽样方法。将行政村作为群,对群中的个体户进行调查。 

    4  二阶与多阶抽样(two-stage or multi-stage sampling)

    为提高整群抽样的效率,对每个被抽中的一级单位所包含的所有二级单位再进行抽样,仅调查其中一部分,这样的抽样称为二阶抽样。如果每个二级单位又由若干个三级单位组成,则对每个被抽中的二级单位再抽样,仅调查其中一部分三级单位,这样的抽样即是三阶抽样。同样可定义四阶甚至更高阶的抽样。多阶抽样也称多阶段抽样或多级抽样。多阶抽样既保留了整群抽样样本相对集中、调查费用较低、不需要包含有所有单位的抽样框等优点,而且由于实行了再抽样,又有效率较高的优点。多阶抽样的主要缺点是抽样时较为麻烦,而且从样本对总体的估计比较复杂。 

    5 系统抽样(systematic sampling)

    系统抽样也称机械抽样。若总体中的单位都按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按照一套事先确定好了的规则确定其他样本单位,这种抽样方法称为系统抽样。最简单的系统抽样是在取得一个初始单位后,按相等的间隔抽取样本单位,这就是所谓的等距抽样。系统抽样最主要的优点是实施简单,因为只有一个初始单位需要随机抽取,而不像简单随机抽样那样,每个样本单位都需要随机抽取。有时系统抽样甚至不需要一个完整的抽样框,它只需要总体单位的一个确定的排列。另外,如果对总体单位的排列规则有所了解并加以正确利用的话,系统抽样能达到相当高的精度。系统抽样最主要的缺点是估计量的精度估计比较困难。事实上许多行之有效的系统抽样并不是严格的概率抽样。 

    6 不等概率抽样(sampling with unequal probabilities)

    样本抽取不一定是等概率的,事实上有时抽样采用不等概率效果更好。特别是在单位大小不相等时,常采用不等概率抽样。最常用的不等概率抽样是按与单位大小成比例的概率抽样。这种抽样,精度较高,数据处理也不复杂。 

    7  二重抽样(double sampling)或双相抽样(two phase sampling)

    二重抽样是指在抽样时分两次抽取样本,在一般情况下先从总体N中抽取一个较大的样本n’,搜集某个项目的资料,另外又从这个大样本中抽选一个较小的样本n,搜集另一些项目的资料,然后结合起来对总体的有关标志值作出估计。有时候第二个样本也可以从总体中独立地抽取。由于样本是分两次抽取的,因此称作二重抽样或双相抽样。当然,这种方法也可以推广到多次抽取样本,然后结合起来对总体的有关标志值作出估计,这就是多重抽样或多相抽样。

    二重抽样可用在抽样框缺乏辅助信息,而又要对总体进行分层或筛选部分总体的情况;由于条件的限制不能收集整个样本信息时,可用二重抽样抽取子样本的方法来收集更详细的信息。类似地,此方法也可用于在一项调查中不同问题的数据收集费用差异很大的情形。

    以上是对几种基本抽样方法的简要介绍。在实际中,很少单独采用一种抽样方法,而常常是几种抽样方法的有机结合。从目前工业抽样调查方案看,首先将规模以下工业总体按行政省份分成31个子总体(层),即按省级行政区划(省、自治区和直辖市,以下简称省)进行分层,每个省构成一个独立的层。其次在每层内即31个省按不同抽样框状况,选择是采用一阶段抽样还是多阶段抽样;第三,确定采用目录抽样还是整群抽样;第四,考虑是否进一步分层,按什么标志分层,分几层,如何分配各层样本。最后,对所分配的样本如何抽取,是采用简单随机抽样还是系统抽样。 

    

[打印本页]  [关闭窗口]
合肥统计信息公众网
站点地图
主办单位:合肥市统计局 地址:安徽省合肥市政务新区政务大楼B座4、7楼 
邮编:230071 E-mail:shenjinxia@hefei.gov.cn 电话:办公室0551-63538938
皖ICP备08001543号-2 皖公网安备 34010402700729号 网站标识码:3401000107
技术支持:北京拓尔思信息技术股份有限公司