全书共分9章,第1章介绍了学习抽样理论需要的预备知识;第2章介绍了抽样理论的若干基本概念;第3章到第7章分别对常规的几种抽样方法——简单随机抽样、分层随机抽样、二阶及多阶抽样、整群抽样和系统抽样,围绕其基本概念、特点、适用场合、具体抽样步骤和相应的简单估计、比率估计和回归估计三种估计量的性质等几个方面,进行了深入详尽的介绍,并且特别对每一种抽样方法的三种估计量的性质融会在一起进行讨论、比较;第8章介绍了实际中极为常见的非概率抽样的各种方式,重点阐释了这些方式与概率抽样的几种抽样方法间的对应关系;第9章是关于与抽样有关但又不属于抽样的一些问题的讨论,帮助实际工作者开阔眼界,避免失误.出于同样的目的,在本书的重要章节还至少给出了一个相应的案例.
本书可作为统计专业的本科生、非统计专业的研究生教材,也可供相关专业的教师及实际从事抽样工作的人员参考.
由于决策科学化程度的提高,调查这种系统地搜集信息的活动已经成为各种研究的基础,“没有调查就没有发言权” 的法则现今在任何领域、任何层面均被普遍认同和遵守。而在任何较大规模的调查中,抽样技术的选择与应用皆是不可避免的。不幸的是,采用抽样技术的做法的普及反而凸显了相关知识普及的不足,除了某些官方机构和学术机构组织的抽样调查比较规范以外,即使那些在大众媒体上亮相频繁、抢尽风头的专业调查公司所公布的抽样方案,在科学意义上也很少称得上规范合格。
笔者在中国人民大学讲授抽样理论十几年,期间也断断续续主持或参与了不少政府或企业的调查设计工作。长期的教学与实践使我感受到,虽然前辈同行迄今做出了巨大努力:国际上一些抽样方面的名著悉数得到翻译,国内也出版了一些专著和教科书,但所有这些相对于人们对抽样技术理论和方法的了解的迫切需要程度来讲,仍相去甚远。坦率地说,国内现存的有关抽样技术的书籍,要么过于专业,内容艰涩难懂;要么过于业余,内容零碎不成系统,其中少数出版物更满是将“总体”混同“人口”之类的低级错误,使人愕然。
鉴于此,本书主要面向那些在大学里讲授抽样技术课程的教师、统计专业的本科生、非统计专业的研究生和相关部门的中高级人士。内容力求详尽而不失精练,结构力求系统而不失紧凑。理论证明步骤明晰,浅显易懂,对数理统计知识要求不多,以便教师备课和读者自学,例题、习题选题广泛,兼顾明理与实用的双重需要。
全书共分9章,第1章介绍了学习抽样理论需要的预备知识,包括排列组合、中心极限定理、参数的区间估计和调查概论;第2章介绍了抽样理论的若干基本概念;第3章到第7章分别对常规的几种抽样方法——简单随机抽样、分层随机抽样、二阶及多阶抽样、整群抽样和系统抽样,围绕其基本概念、特点、适用场合、具体抽样步骤和相应的简单估计、比率估计和回归估计三种估计量的性质等几个方面,进行了深入详尽的介绍。特别地,对每一抽样方法的三种估计量的性质融会在一起进行讨论、比较,构成了本书的特色之一。本书的另一个特色是对不等概率抽样的处理,对其不做独立的讨论,但强调在次级或基本单元的层次上仍属于等概率抽样的特点,这样有助于读者更好地理解所谓不等概率抽样的实质,避免无谓的混淆。第8章介绍了实际中极为常见的非概率抽样的各种方式,重点阐释了这些方式与概率抽样的几种抽样方法间的对应关系。这个问题是极其重要的,可惜国内外绝大多数抽样文献都未给予必要的重视。最后一章是关于与抽样有关但又不属于抽样的一些问题的讨论,帮助实际工作者开阔眼界,避免失误。出于同样的目的,在本书的重要章节还至少给出了一个相应的案例。
抽样技术及其应用Sampling Techniques and Practices前言在本书写作过程中,我的一些研究生朱华鹏、姜莉莉、江智杰、徐瑶、徐晓菊、牛奇和王欣等同学给予了许多帮助,他们不仅参与了部分章节的撰写、习题案例的寻找,还帮助调整了全部的格式。特别是朱华鹏和姜莉莉,对本书的结构提出了很多宝贵建议,又反复阅读和校对了全部书稿,保证了稿件的按时完成。在此谨表示诚挚的谢意。最后,作者还要特别感谢我的同事张波教授,他对本书的顺利完成助益良多,付出了很多心血与努力。
由于作者水平有限,写作亦较仓促,虽然诚惶诚恐,殚精竭虑,但不足之处仍然在所难免,甚至可能不少,敬请有关专家、同行和广大读者赐教、斧正。
第1章预备知识11.1排列组合1
1.1.1基本原理1
1.1.2排列2
1.1.3组合2
1.2概率统计中的一些基本原理3
1.2.1大数定律3
1.2.2中心极限定理4
1.2.3参数估计6
1.3调查概论11
1.3.1调查与测量11
1.3.2真值、测量值与误差16
1.3.3信度、效度与精度22
思考与练习26
参考文献27
第2章基本概念28
2.1抽样调查与非抽样调查28
2.2总体与样本34
2.2.1总体34
2.2.2抽样框与抽样单元35
2.2.3抽样与样本36
2.3总体特征与估计量37
2.3.1总体特征37
2.3.2估计量和估计方法39
2.3.3抽样分布40
2.4误差与精度42
2.4.1均方误差与偏倚43
2.4.2置信区间与误差限44
2.4.3费用与效率45
2.5几种基本的抽样方法46
2.5.1简单随机抽样46
2.5.2分层抽样46
2.5.3整群抽样48
2.5.4系统抽样48
2.5.5多阶段抽样49
*2.6抽样调查的实施步骤50
思考与练习53
参考文献54
第3章简单随机抽样55
3.1定义与符号56
3.2简单估计量及其性质64
3.2.1简单估计的性质65
3.2.2简单估计量的方差与协方差69
3.2.3方差与协方差的估计76
3.3比率估计量及其性质81
3.3.1比率估计量的性质82
3.3.2比率估计量的方差估计86
3.3.3比率估计的其他问题89
3.4回归估计量及其性质93
3.4.1回归估计的性质94
3.4.2多变量回归估计98
3.4.3各种估计量的精度比较99
3.5简单随机抽样的实施101
3.5.1样本容量的确定原理101
3.5.2样本量的确定步骤104
3.5.3简单随机抽样的实施105
附件A中华人民共和国国家标准
利用随机数骰子进行随机抽样的方法110
附件B中华人民共和国国家标准
利用电子随机数抽样器进行随机抽样的方法114
思考与练习120
参考文献123
第4章分层随机抽样124
4.1定义与符号124
4.1.1定义124
4.1.2符号126
4.2简单估计量及其性质126
4.2.1总体均值的简单估计量及其性质126
4.2.2总体总量的简单估计量及其性质129
4.2.3总体比例的简单估计量及其性质132
4.3比率估计量及其性质133
4.3.1分别比估计134
4.3.2联合比估计135
4.3.3分别比估计与联合比估计的比较137
4.3.4分层抽样中采取比率估计时的最优分配138
4.4回归估计量及其性质142
4.4.1分别回归估计142
4.4.2联合回归估计145
4.4.3分别回归估计与联合回归估计的比较148
4.4.4比率估计与回归估计小结154
4.5各层样本量的分配155
4.5.1比例分配156
4.5.2最优分配157
4.5.3奈曼最优分配160
4.5.4某些层需要进行大于100%抽样的修正162
4.5.5偏离最优分配时对精度的影响164
4.5.6多变量情况下样本量在各层的分配166
4.6总样本量的确定170
4.6.1估计总体均值时样本量的确定170
4.6.2估计总体总量时样本量的确定175
4.6.3估计总体比例时样本量的确定178
4.6.4总费用给定时总样本量的确定180
4.7层的构成和分层界限的确定181
4.7.1分层标志的选择181
4.7.2分层界限的确定181
4.7.3确定分层界限的其他方法187
4.8层数的确定187
4.8.1根据目标变量Y值确定层数188
4.8.2根据其他变量X值确定层数189
4.8.3考虑费用因素时层数的确定190
4.9分层随机抽样的精度研究191
4.9.1分层随机抽样与简单随机抽样精度比较191
4.9.2最优分配在精度上的改进193
4.9.3分层随机抽样精度反比简单随机抽样差的情况194
4.9.4从分层样本来估计分层随机抽样的效果196
4.9.5层权误差对估计量的影响202
4.9.6每层只抽取一个单元时的方差估计207
4.10分层抽样的其他方面210
4.10.1多重分层210
4.10.2事后分层215
4.10.3子总体的估计220
4.10.4定额抽样230
4.11案例231
附件C234
附件D1993年人口变动情况抽样调查样本设计参考资料235
附件E省级人口变动情况抽样误差计算公式和总体人口出生率的
估计方法238
思考与练习241
参考文献246
第5章多阶(段)抽样247
5.1概述248
5.1.1定义及特点248
5.1.2二阶(段)抽样的预备知识249
5.2初级单元大小相等时的二阶(段)抽样250
5.2.1符号250
5.2.2总体均值的估计量及其性质251
5.2.3总体比例的估计256
5.2.4最优样本量m与n的确定259
5.2.5分层二阶(段)抽样262
5.3初级单元大小不等情形(n=1)265
5.3.1一般说明和符号265
5.3.2等概率抽取初级单元267
5.3.3不等概率抽取初级单元269
5.3.4n=1时五种方法的总结272
5.4初级单元大小不等时的二阶(段)抽样(n>1)275
5.4.1采用放回的抽样方式——按不等概率抽取
初级单元276
5.4.2采用不放回的抽样方式281
5.4.3估计比例的二阶(段)抽样289
5.5二阶(段)抽样的效率292
5.5.1二阶(段)抽样与简单随机抽样比较292
5.5.2二阶(段)抽样与分层抽样比较293
5.5.3二阶(段)抽样与整群抽样比较293
5.5.4小结294
5.6三阶(段)及多阶抽样294
5.6.1各级单元大小相等的三阶(段)抽样295
5.6.2各级单元大小不等的三阶(段)抽样297
5.7案例300
案例1“网民知多少?”——中国互联网络信息中心全国调查
抽样方案设计300
案例2第二次国家卫生服务调查设计方案306
附件F国家卫生服务总调查样本地区和样本个体的抽取方法312
思考与练习323
参考文献328
第6章整群抽样329
6.1概述329
6.1.1整群抽样的基本概念329
6.1.2整群抽样的特点及适用场合331
6.2群规模大小相等的情形333
6.2.1符号说明333
6.2.2估计量及其性质334
6.2.3总体方差S2的估计336
6.2.4群内相关系数与设计效应341
6.2.5整群抽样的效率分析345
6.3群规模大小不等的情形349
6.3.1符号说明349
6.3.2对群进行简单随机抽样的简单估计350
6.3.3对群进行简单随机抽样的比估计352
6.3.4对群进行不等概率抽样354
6.4对比例估计的整群抽样356
6.4.1问题的提出356
6.4.2群规模相等的情形356
6.4.3群规模不相等的情形358
6.5案例366
思考与练习373
参考文献377
第7章系统抽样378
7.1定义与实施方法379
7.2等概率情形的估计量及其性质382
7.2.1符号说明382
7.2.2估计量的性质384
7. 3方差估计及其改进394
7.3.1方差的近似估计394
7.3.2线性排列情形抽样与估计的改进396
7.4不等概率系统抽样403
7.4.1概述及实施方法403
7.4.2估计量的方差估计404
7.5案例407
思考与练习412
参考文献415
第8章非概率抽样416
8.1非概率抽样概述416
8.1.1概念及适用场合416
8.1.2具体的抽样方法418
8.2非概率抽样的理论基础423
8.2.1非概率抽样与模型抽样423
8.2.2非概率抽样的效度与信度424
8.2.3非概率抽样与概率抽样的对应关系430
8.3非概率抽样中的估计432
8.3.1非概率样本的估计问题432
8.3.2捕获再捕获中的估计433
8.4样本容量与抽样实施436
8.4.1样本容量确定的出发点436
8.4.2确定样本容量的几种思路438
8.4.3配额抽样设计样本量的确定441
8.4.4非概率抽样方法的实施445
8.5案例448
案例1关于某市宾馆、饭店、娱乐场所扰民噪声的抽样
调查448
案例21997年我国进行的城市环境状况和居民环境
意识的配额抽样调查450
思考与练习453
参考文献454
第9章其他专题455
9.1敏感性问题的处理455
9.1.1沃纳随机化回答模型455
9.1.2西蒙斯随机化回答模型457
9.1.3使用随机化回答方法应注意的问题459
9.1.4随机截尾模型459
9.2无回答误差处理461
9.2.1无回答的概念及类型461
9.2.2无回答的影响462
9.2.3降低无回答率的方法463
9.2.4对无回答的调整464
9.3捕获再捕获抽样469
9.3.1直接抽样法469
9.3.2逆抽样方法472
9.4样本轮换473
9.4.1样本轮换的最优比例474
9.4.2样本轮换应遵循的原则476
9.4.3案例说明476
思考与练习477
参考文献478
练习题参考答案479