
一、简答题
1.请列举出四种基本的概率抽样方法,并简要说明各种抽样方法的思想。
2. 简述分层随机抽样相对于简单随机抽样的优点。
二、计算题
1.现有一个容量为30的样本:
| 55 | 40 | 59 | 57 | 76 | 79 | 78 | 38 | 75 | 48 |
| 80 | 38 | 84 | 66 | 43 | 62 | 76 | 45 | 79 | 55 |
| 41 | 69 | 59 | 42 | 56 | 46 | 84 | 65 | 73 | 52 |
(2)假如已知总体的标准差为15,试计算的方差、标准差。并构造总体的置信度为95%的置信
区间;
(3)假如总体的标准差未知,由样本数据估计的方差、标准差。并构造总体的置信度为95%的
置信区间。
2.一个县内所有农场按规模大小分层,各层内平均每个年农场谷物(玉米)的英亩数列在下表中。
| 农场规模(英亩) | 农场数 | 平均每一农场的玉米面积 | 标准差 |
| 0—40 41—80 81—120 121—160 161—200 201—240 | 394 461 391 334 169 113 148 | 5.4 16.3 24.3 34.5 42.1 50.1 63.8 | 8.3 13.3 15.1 19.8 24.5 26.0 35.2 |
| 总和或均值 | 2010 | 26.3 | -- |
(1)按比例分配时,各层的样本量为多少?
(2)按最优分配时,各层的样本量为多少?(假定各层的单位调查费用相等)
(3)分别将比例分配、最优分配的精度与简单随机抽样的精确度比较。
3、为调查某5443户城镇居民服装消费情况,采用简单随机不重复抽样调查了36户进行调查,得到平均消费支出元,试根据此估计:
(1)该地区居民服装消费支出总额,并给出置信水平为95%的置信区间。
(2)如果希望服装平均消费支出的相对误差限不超过5%,则样本量至少应为多少?
4、某地区10000名群众,现欲估计在拥有本科学历及以上的群众所占的比例,随机不重复抽取了300名群众进行调查,得到,试估计该地区群众拥有本科以上学历的比例,并以正态分布近似给出其95%的置信区间。
5、对某地区171 980户居民家庭收入进行调查,以居民户为抽样单位,根据城镇和乡村将居民划为2层,每层按简单随机抽样抽取300户,经整理得如下数据:
| 层 | ||||
| 城镇 | 23560 | 15180 | 0.137 | 2972 |
| 乡村 | 148420 | 9856 | 0.863 | 2546 |
(1)居民平均收入及其95%的置信区间。
(2)若是按比例分配和奈曼分配时,各层样本量分别应为多少?
6、某居民小区共有600个单元,每个单元均居住15户,现以单元为群进行整群抽样,随机抽取8个单元,调查每户每周的食品支出费用,调查结果经整理,各单元样本均值和标准差如下表所示:
| 205 | 219 | 202 | 218 | 212 | 217 | 208 | 220 | |
| 30.61 | 32.14 | 29.62 | 28.36 | 25.84 | 33.59 | 34.20 | 26.84 |
(1)该居民小区平均每户每周食品支出费用,并给出其置信水平为95%的置信区间。
(2)计算以单元为群的群内相关系数与设计效应
7、某县有300个村,小麦播种面积为23 434亩。全部村子按地势分为平原和山区两种类型,各按10%的抽样比抽样,调查亩产量,经整理得到下表结果,以大写字母表示总体数据,小写字母表示样本数据,Y代表调查变量,为今年的总产量,X代表辅助变量,为去年的总产量,相应的均值为平均亩产量。
| 类型 | |||||
| 平原 | 102 | 0.34 | 583 | 561 | 568 |
| 山区 | 198 | 0.66 | 290 | 274 | 271 |
3、证明题
1.假设总体中每个单元有两个指标和, i = 1,…,N,记为相应的简单随机样本的均值。试证样本协方差是总体协方差的无偏估计。
