
一、单选题
1.整群抽样中的群的划分标准为( A )。
A.群的划分尽可能使群间的差异小,群内的差异大
B.群的划分尽可能使群间的差异大,群内的差异小
C.群的划分尽可能使群间的差异大,群内的差异大
D.群的划分尽可能使群间的差异小,群内的差异小
2.整群抽样的一个主要特点是( C )。
A.方便
B.经济
C.可以使用简单的抽样框
D.特定场合中具有较高的精度
3.群规模大小相等时,总体均值的简单估计量为( A )。
A.
B.
C.
D.
4.下面关于群内相关系数的取值说法错误的是(D )。
A.若群内次级或基本单元变量值都相等则,此时取最大值1
B.若群内方差与总体方差相等,则
C.若群内方差大于总体方差时,则取负值
D.若时,达到极小值,此时
5.整群抽样中,对比例估计说法正确的是( B )。
A.群规模相等时,总体比例P的估计可以为:
B.群规模不等时,总体比例P的估计可以为:
C.群规模相等时,总体比例P的方差估计为:
D.群规模不等时,总体比例P的方差估计为:
二、多选题
1.下面关于整群抽样的说法,有哪些是正确的?(ABC DE )
A.通常情况下抽样误差比较大
B.整群抽样可以看作为多阶段抽样的特殊情形,即最后一阶抽样是100%的抽样
C.调查相对比较集中,实施便利,节省费用
D.整群抽样的方差约为简单随机抽样的方差的倍
E.为了获得同样的精度,整群抽样的样本量是简单随机抽样的倍
2.关于整群抽样(群规模相等)的设计效应,下面说法正确的有(ABCD )
A.
B.为了获得同样的精度,整群抽样的样本量是简单随机抽样的倍
C.群内相关系数的估计值为
D.要提高整群抽样估计效率,可通过增大群内单元的差异实现
E.整群抽样的精度取决于群内相关系数,群内相关系数越大,则估计量的精度越高
3.关于群规模不等时,可以采用的估计量形式有( B CD)。
A.
B.
C.
D.
E.
三、名次解释
群内相关系数
四、计算题
1. 设某灯泡厂每天生产一批灯泡共200盒,每盒装灯泡6只,今随机抽取8盒,检验其点燃小时数的资料,如下表所列。
某灯泡厂点燃小时数的检验资料 单位:小时
| 1 | 2 | 3 | 4 | 5 | 6 | 合计 | 平均 | |
| 1 2 3 4 5 6 7 8 | 1036 1047 1046 1153 1216 9 1113 1047 | 1075 1126 1153 1078 1094 1136 1093 1097 | 1125 1183 1087 1039 1096 1185 1005 1136 | 995 1058 984 1006 1035 1021 1088 9 | 1088 1142 1224 1214 1004 1083 997 1073 | 1065 1098 998 1076 1053 1007 1034 1105 | 6384 6654 92 6566 98 6396 6330 44 | 10 1109 1082 1094 1083 1066 1055 1074 |
| 合计 | — | — | — | — | — | — | 517 | 8627 |
(2)如果点燃小时数不到1000的为不良品,计算其样本不良率,并分别按整盒和按灯泡计算其抽样方差,比较何者较优。
2. 某大学为了估计全校学生在1991年夏天对安徽、江苏灾区的捐款总数,从全校124个班随机的抽取10个班级进行调查,数据如下表所示,并假定这10个班的400名学生中分别捐4.5元,5.0元,5.5元,6.0元和6.5元的都各有80名。
10个班级的捐款情况 单位:元
| 班级编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 捐款总数 | 221 | 192 | 198 | 267 | 230 | 201 | 257 | 188 | 205 | 243 |
(2)计算该校学生捐款总数估计值的抽样方差,以及捐款总数的95%的置信区间。
3. 在一次对某寄宿中学在校生零花钱的调查中,以宿舍作为群进行整群抽样。每个宿舍有6名学生。用简单随机抽样在全部315间宿舍中抽取n=8间宿舍、全部48个学生上周每人的零花钱及相关计算数据如下表。试估计该学校平均每个学生每周的零花钱,并给出其95%的置信区间。
| 宿舍1 | 宿舍2 | 宿舍3 | 宿舍4 | 宿舍5 | 宿舍6 | 宿舍7 | 宿舍8 | |
| 学生1 学生2 学生3 | 58 83 74 | 91 83 79 | 123 94 | 99 105 98 | 110 99 132 | 111 100 116 | 120 115 117 | 96 80 63 |
| 学生4 学生5 学生6 | 82 66 87 75.00 125.60 | 111 101 69 .00 233.60 | 109 79 80 95.67 299.07 | 107 129 90 104.67 177.87 | 87 99 124 108.50 287.50 | 99 107 105 106.33 42.27 | 99 106 120 112.83 72.57 | 130 105 86 93.33 527.87 |
5. 带锯厂负责对他的用户进行修理,其修理费用每季结算一次。该厂共有96家用户,各拥有不同带锯数,现采用等概简单随机方法抽取20家为样本,资料如下:
| 工厂 | 锯数 | 修理费用(元) |
| 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 | 3 7 11 9 2 12 14 3 5 9 8 6 3 2 1 4 12 6 5 8 | 50 110 230 140 60 280 240 45 60 230 140 130 70 50 10 60 280 150 110 120 |
(2)根据上述资料估计96家用户的修理费用及置信区间(а=0.05)。
(3)若已知这96家用户有710条带锯,利用这一补充信息估计总的修理费用和置信区间。
(4)欲估计下一季度的每带锯平均管理费用,绝对误差Δ=2,试问应抽取多少户作样本。
6. 邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个群,每群10户,现随机抽取4个群,取得资料如下所示:
| 群 | 各户订报数() | |
| 1 2 3 4 | 1,2,1,3,3,2,1,4,1,1 1,3,2,2,3,1,4,1,1,2 2,1,1,1,1,3,2,1,3,1 1,1,3,2,1,5,1,2,3,1 | 19 20 16 20 |
7. 汽车运输公司抽样调查在使用的车辆中不安全轮胎的比例,在175辆车中抽中了25辆,其不安全的轮胎数如下:
| 不安全轮胎个数 | 汽车数 |
| 0 1 2 3 4 | 5 8 7 2 3 |
8. 某市建筑行业集团共有48个单元,有载货汽车186辆。按每个单元的车辆拥有量成比例的概率进行放回的PPS抽样,共抽取10次,对抽中单元的所有车辆调查季度运量(单位:吨)。样本数如下(其中有一单元被抽中2次,即i=3,7)。试估计全集团的季度总运量及95%的置信区间。
单元
| 编号 | 车辆 数() | 单元运量 总和() | 平均每车 运量() |
| 1 2 3 4 5 6 7 8 9 10 | 5 8 5 4 6 9 5 3 7 3 | 14230 21336 13650 11568 15216 23049 13650 7443 16273 8391 | 2846 2667 2730 22 2536 2566 2730 2481 23 2797 |
| i | i | |||||
| 1 | 4 | 0.5 | 7 | 5 | 0.625 | |
| 2 | 3 | 0.375 | 8 | 2 | 0.25 | |
| 3 | 5 | 0.625 | 9 | 6 | 0.75 | |
| 4 | 6 | 0.75 | 10 | 4 | 0.5 | |
| 5 | 3 | 0.375 | 11 | 3 | 0.375 | |
| 6 | 4 | 0.5 | 12 | 5 | 0.625 |
(1) 少数民族的居住比较集中;
(2)少数民族比较均匀得分布在各街道;
(3)少数民族分散在各街道但比重不同。
11. 某一社会研究机构,研究南方某一城镇的社会民俗等情况。设该镇共有415个居民小组,现从中按简单随机抽样抽取25个居民小组作样本,取得了以下一些数据。
| 样本数 | 户数 | 其中三代人户数 | 总收入 | 样本数 | 户数 | 其中三代人户数 | 总收入 |
| 1 2 3 4 5 6 7 8 9 10 11 12 13 | 8 12 4 5 6 6 7 5 8 3 2 6 5 | 4 7 1 3 3 4 4 2 3 2 1 3 2 | 96000 121000 42000 65000 52000 40000 75000 65000 45000 50000 85000 43000 54000 | 14 15 16 17 18 19 20 21 22 23 24 25 | 10 9 3 6 5 5 4 6 8 7 3 8 | 6 4 1 4 2 3 1 3 3 4 0 3 | 49000 53000 50000 32000 22000 45000 37000 51000 30000 39000 47000 4100 |
| 合计 | 151 | 72 | 1329000 |
(1)估计该地区户平均收入及其标准差。
(2)估计三代人的户占总户数的比例,并计算其标准差;
(3)若以上两项估计的相对标准差均控制在5%,应抽取多少居民小组(群)作样本。
12. 一带锯厂对它的用户负责进行维修,按季定期进行结算,但缺乏每一带锯的平均修理费用,该厂共有96家用户,各拥有不同的带锯数。现用简单随机抽样抽取20家作样本,其其资料如下:
| 样本 | 锯数 | 修理费用 | 样本 | 锯数 | 修理费用 |
| 1 2 3 4 5 6 7 8 9 10 | 3 7 11 9 2 12 14 3 5 9 | 50 110 230 140 60 280 240 45 60 230 | 11 12 13 14 15 16 17 18 19 20 | 8 6 3 2 1 4 12 6 5 8 | 140 130 70 50 10 60 280 150 110 120 |
(1)估计每一带锯的平均修理费用及其抽样标准误差;
(2)在未知总体带锯数的条件下估计96家用户总的修理费用及估计标准误;
(3) 若已知这96家用户共有740条带锯,利用这一补充信息估计总的修理费用和估计的标准误;
(4) 若欲估计下一季度每一带锯饿平均修理费用,允许最大绝对误差为d=2,置信度为95%,应抽取多少家用作样本。
13. 汽车运输公司抽样检查在使用的车辆中不安全轮胎的比例,在175辆车中抽取了25辆,其不安全轮胎数如下:
| 不安全轮胎数 | 汽车数 |
| 0 1 2 3 4 | 5 8 7 2 3 |
14. 某工业系统准备一项改革措施,对全系统的人进行一项测验,该系统共有87个单位,现采用整群抽样,用简单随机抽取15个单位作为样本,读抽中的单位作全面征求意见,其结果如下:
| 单位 | 总人数 | 赞成人数 |
| 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | 51 62 49 73 101 48 65 49 73 61 58 52 65 49 55 | 42 53 40 45 63 31 38 30 54 45 51 29 46 37 42 |
(1) 估计该系统同意这一改革人数的比例,并计算估计标准误;
(2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的绝对误差不超过4%,置信度为95%,则应抽多少个单位作样本。
15. 在一个估计总体比例问题的抽样设计中,首先作了试调查,研究群的大小与群间方差之间的关系,取得下列数据
| 群平均大小 | 群平均大小 | ||
| 1 2.25 4 6.25 9 | 0.1120 0.0813 0.0659 0.0577 0.0505 | 12.25 16 25 36 | 0.0454 0.0419 0.0398 |
16. 假设整群抽样的样本群数为n,每个群有M个单元,群间方差为,群内方差为试对整群抽样与相同样本量的简单随机抽样的效率的比较进行讨论(fpc可忽略不计)。
17. 在一次农村调查中,抽样单元是包含M个农场的群,当抽取n个群作样本时,其费用是:,其中t是调查一个农场所花的时间(按小时计算)。如果这一调查的总费用是2000元,当M=1,5,10,t=0.5,2时,n的数值计算如下:
| M | |||
| 1 | 5 | 10 | |
| t=0.5 t=2 | 400 156 | 131 40 | 74 21 |
五、简答题
1. 什么是整群抽样,整群抽样有哪几个步骤?
2. 整群抽样有哪些优点?
3. 整群抽样与多阶段抽样及分层抽样的区别?
4. 整群抽样与分层抽样的区别;
5. 整群抽样群大小的计量方法;
6. 整群抽样的设计效应。
六、设计题
欲调查城市的猪肉人均消费量,讨论下列情况下采用街道作为群的整群抽样是否合适,如果不合适,你认为采用什么抽样方式好。
(1)少数民族的居住比较集中;
(2)少数民族比较均匀地分布在各条街道;
(3)少数民族分散在各街道,但比重不同。
