一、单项选择题(共20小题,每小题2分,共计40分)
1.统计数据的搜集、整理、图表展示以及运用数据的特征值来反映统计数据的分布规律属于: A
A描述统计 B推断统计 C抽样分析 D经验统计
2.根据样本调查数据,制作统计数据分布直方图属于: A
A描述统计 B推断统计 C抽样分析 D经验统计
3.从总体中抽取的一部分单位组成的集合称作: B
A总体 B样本 C参数 D统计量
4.根据从无锡市随机抽取1000个家庭组成的样本,得到订阅报纸的家庭数位868个,那么样本比例86.8%被称为? C
A总体 B样本 C参数 D统计量
5. 指出下面的数据哪一个属于分类数据: D
A 年龄 B 工资 C 汽车产量 D 购买商品的支付方式(现金、信用卡、支票)
6.指出下面的数据哪一个属于顺序数据: D
A 年龄 B 工资
C 汽车产量 D 员工对企业某项制度改革措施的态度(赞成、中立、反对)
7.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是: C
A 2000个家庭 B 200万个家庭 C 2000个家庭的人均收入 D 200万个家庭的人均收入
8.了解居民的消费支出情况,则: B
A 居民的消费支出情况是总体 B 所有居民是总体
C 居民的消费支出情况是总体单位 D 所有居民是总体单位
9.统计学研究的基本特点是: B
A 从数量上认识总体单位的特征和规律 B 从数量上认识总体的特征和规律
C 从性质上认识总体单位的特征和规律 D 从性质上认识总体的特征和规律
10.出于海洋环境保护的需要,广东省出台一个税种。现在想了解居民对于税收的反应,那种数据搜集方式比较合适: C
A设计一个实验 B通过查阅出版刊物 C随机抽样 D观测数据
11.下面哪一项属于离散型数据: D
A上证综合指数B大坝排出水的体积C一辆汽车的行驶里程D某保险公司的雇员人数
12.从含有N个元素的总体中抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为( A )
A简单随机抽样 B分层抽样 C系统抽样 D整群抽样
13.为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是( D )
A简单随机抽样 B分层抽样 C系统抽样 D整群抽样
14.为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名进行调查,这种调查方式是( C )
A简单随机抽样 B分层抽样 C系统抽样 D整群抽样
15.在一项调查中,调查单位和填报单位( D )
A无区别,是一致的 B有区别,是不一致的
C无区别,是人为确定的 D有区别,但有时是一致的
16.对家用电器的平均寿命进行调查,应该采用( D )
A普查 B重点调查 C典型调查 D抽样调查
17.在累计次数分布中,某组的向下累计次数表明( B )
A大于该组上限的次数是多少 B大于该组下限的次数是多少
C小于该组上限的次数是多少 D小于该组下限的次数是多少
18.数据筛选的主要目的是( C )
A发现数据的错误 B对数据进行排序
C找出所需要的某类数据 D纠正数据中的错误
19.样本或总体中各不同类别数值之间的比值称为( D )
A频率 B频数 C比例 D比率
20.将比例乘以100得到的数值称为( B )
A频率 B频数 C比例 D比率
二、判断题(共10小题,每小题2分, 共计20分)
1.对问题“你在目前的城市居住多长时间”的回答是连续变量。 T
2.推断统计经常对未被观察的总体给出一个参数估计值。 T
3.对于问题“你喜欢的颜色”的回答是一个顺序变量的例子。 F
4.某企业工会决定给所有员工发一个公文包作为员工福利,随机抽取200员工调查“你喜欢的公文包颜色”。该企业所有员工构成研究总体。 T
5.调查对象和调查单位是指向谁调查的问题。 T
6.调查项目是调查的具体内容,调查项目就是调查单位的某个或某些属性。 T
7.从单位数为N的总体中抽取容量为n的样本,重置抽样方式下,理论上有(从N中取n得组合数)个可能样本。 F
8.分层抽样要取得良好的效果,理想的分层变量是那些与测量变量不存在高度相关的变量。 F
9.开放式问题是指对问题的回答未提供任何具体的备选答案,由被调查者根据自己的想法自由作出回答,属于自由回答型。 T
10.抽样误差是一种随机误差,只存在于概率抽样中,而非抽样误差则可以存在于概率抽样、非概率抽样,也有可能存在于全面调查中。 T
三、多项选择题(共5小题,每小题2分,共计10分)
1.欲了解某地高等学校科研情况: BD
A该地所有高等学校所有的科研项目是总体
B该地所有的高等学校是总体
C该地所有高等学校的每一科研项目是总体单位
D该地每一所高等学校是总体单位
E该地所有高等学校的所有科研人员是总体
2.下列属于原始数据的是( BDE )
A统计部门掌握的数据 B说明总体单位特征的数据
C说明总体特征的数据 D还没有经过分组汇总的数据
E直接向调查单位登记得到的数据
3统计调查方案的内容包括有( ABCDE )
A确定调查目的
B确定调查对象调查单位和报告单位
C确定调查项目和调查表
D确定调查方法和调查时间
E确定调查人员经费等
4.重点调查的“重点”单位指( BCE )
A在国民经济中作用重要的单位
B标志值在总体标志总量中所占比重比较大的单位
C全部单位中的一小部分单位
D在国民经济中地位显赫的单位
E能反映总体基本情况的单位
5.下列应该用几何平均法计算的有( BCE )
A 生产同种产品的三个车间的平均合格率
B 平均发展速度
C 前后工序的三个车间的平均合格率
D 平均劳动生产率
E 以复利支付利息的年平均利率
四、计算题(每小题10分,共计30分)
1.求数据集3,9,0,8,5的平均数、中位数、样本方差和样本标准差。
解:,中位数位置3,故中位数数值为5。
,
2.下面是某班级学生成绩分组表:
成绩分组 | 人数(语文) | 人数(数学) |
60以下 | 2 | 6 |
60-70 | 12 | 10 |
70-80 | 22 | 15 |
80-90 | 10 | 12 |
90以上 | 4 | 7 |
合计 | 50 | 50 |
解:
成绩分组 | 组中值 | 人数(语文) | 人数(数学) |
60以下 | 55 | 2 | 6 |
60-70 | 65 | 12 | 10 |
70-80 | 75 | 22 | 15 |
80-90 | 85 | 10 | 12 |
90以上 | 95 | 4 | 7 |
合计 | 50 | 50 |
,
s=9.68
数学课程
,
s=12.27
所以,数学成绩的差异大一些。因为数学的标准差系数大(12.27/75.8>9.68/75.4)
3. 试根据数据计算职工到单位上班时间的方差和标准差。变量值:29 31 35 38 40 42 45 46 50 52
解:由于
《统计学》第二阶段练习题
一、单项选择题(共20小题,每小题2分,共计40分)
1.根据概率的统计定义,可用以近似代替某一事件的概率的是 ( A )。
A 大量重复试验中该随机事件出现的次数占试验总次数的比重
B 该随机事件包含的基本事件数占样本空间中基本事件总数的比重
C 大量重复随机试验中该随机事件出现的次数
D 专家估计该随机事件出现的可能性大小
2.下列事件中不属于严格意义上的随机事件的是 ( D )。
A 从一大批合格率为90%的产品中任意抽出的一件产品是不合格品
B 从一大批合格率为90%的产品中任意抽出的20件产品都是不合格品
C 从一大批优质品率为15%的产品中任意抽出的20件产品都是优质品
D 从一大批合格率为100%的产品中任意抽出的一件产品是合格品
3.假设A B为两个互斥事件,则下列关系中,不一定正确的是 ( B )。
A P(A+B)=P(A)+P(B) B P(A)=1-P(B)
C P(AB)=0 D P(A|B)=0
4.同时抛3枚质地均匀的硬币,巧合有2枚正面向上的概率为 ( C )。
A 0.125 B 0.25 C 0.375 D 0.5
5.下列由中心极限定理得到的有关结论中,正确的是 ( D )。
A 只有当总体服从正态分布时,样本均值才会趋于正态分布
B 只要样本容量n充分大,随机事件出现的频率就等于其概率
C 无论样本容量n如何,二项分布概率都可以用正态分布近似计算
D 不论总体服从何种分布,只要样本容量n充分大,样本均值趋于正态分布
6.在同等条件下,重复抽样与不重复抽样相比较,其抽样平均误差( B )
A前者小于后者 B前者大于后者 C两者相等
D无法确定哪一个大
7.在其他条件保持不变的情况下,抽样平均误差( B )
A随着抽样数目的增加而加大
B随着抽样数目的增加而减少
C随着抽样数目的减少而减少
D不会随抽样数目的改变而变动
8.允许误差反映了样本指标与总体指标之间的( D )
A抽样误差的平均数 B抽样误差的标准差
C抽样误差的可靠程度 D抽样误差的可能范围
9.根据组(群)间方差的资料计算抽样平均误差的抽样组织方式是( D )
A纯随机抽样 B机械抽样
C类型抽样 D整群抽样
10.若总体平均数X=50,在一次抽样调查中测得X=48。则以下说法正确的是( C )
A抽样极限误差为2 B抽样平均误差为2
C抽样实际误差为2 D以上都不对
11.对于分层抽样,以下说法正确的是( A )
A不同类别的单位被抽中的概率可能不相等
B分层抽样误差只受层间方差的影响,不受层内方差的影响
C分层抽样在分层时应使各层之间的差异尽可能小
D由于在分层时使用了一些辅助信息,因此分层抽样违背了随机原则
12.从2 000名学生中按不重复抽样方法抽取了100名进行调查,其中有女生45名,则样本成数的抽样平均误差为( B )
A 0.24% B 4.85% C4.97% D以上都不对
13.从l,2,3,4,5,五个数构成的总体中不重复地随机抽取两个作为样本,则对于所有可能样本的样本均值,以下说法正确的是(D )
A样本均值的实际抽样误差的最大值为2
B样本均值为3的概率是25%
C样本均值为3的概率为40%
D以上都不对
14.抽样平均误差与样本容量的关系是( A )
A 样本容量越大,抽样平均误差越小
B 样本容量越小,抽样误差越小
C 样本容量越大,抽样平均误差越大
D 前述三个都不对
15. 抽样平均误差(μ)和抽样极限误差(Δ)的关系是( D )
AΔ大于或等于μ BΔ小于μ CΔ大于μ D两者不存在必然关系
16.对于正态分布变量X,若为( A )
A0.68 B 0.95 C0.34 D 0.99
17. 根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求边际误差不超过4%,应抽取多大的样本?(A)
A47 B48 C24 D25
18. 我们希望从n个观察的随机样本中估计总体均值,过去的经验显示σ=12.7。如果希望估计µ正确的范围在1.6以内,概率为0.95,应抽取样本中包含的样品数位(D )。
A306 B307 C316 D317
19.下列描述正确的是( C )
A点估计比区间估计需要更大的样本容量
B点估计相对于区间估计更加准确
C点估计无法给出参数估计值的置信度和误差大小
D区间估计无法给出参数估计值的置信度和误差大小
20. 在简单重复随机抽样条件下,欲使误差范围缩小1/2,其他要求保持不变,则样本容量必须( B )
A增加2倍 B增加到4倍
C减少2倍 D减少3倍
二、判断题(共10小题,每小题2分, 共计20分)
1.样本空间是指随机试验出现的所有可能结果集合。T
2.基本事件也称作简单事件,一次随机试验的某个最基本的结果,基本事件是不可再拆分的。T
3.概率的定义方法有古典概率、试验概率和主观概率。T
4.概率的乘法公式中,事件A、B是互斥事件。F
5. 概率的加公式中,事件A、B是事件。F
6. 一批布匹单位面积上出现的疵点数X是连续性随机变量。F
7.当p=0.5时,二项分布为对称分布。T
8.标准正态分布变量|Z|<1的概率为90%。F
9.根据样本观察值所计算的样本特征值被称为统计量。T
10.抽样分布是指样本统计量的概率分布规律。T
三、多项选择题(共5小题,每小题2分,共计10分)
1.欲了解某地高等学校科研情况( BD )
A该地所有高等学校所有的科研项目是总体
B该地所有的高等学校是总体
C该地所有高等学校的每一科研项目是总体单位
D该地每一所高等学校是总体单位
E该地所有高等学校的所有科研人员是总体
2.下列属于原始数据的是( BDE )
A统计部门掌握的数据 B说明总体单位特征的数据
C说明总体特征的数据 D还没有经过分组汇总的数据
E直接向调查单位登记得到的数据
3统计调查方案的内容包括有( ABCDE )
A确定调查目的
B确定调查对象调查单位和报告单位
C确定调查项目和调查表
D确定调查方法和调查时间
E确定调查人员经费等
4.重点调查的“重点”单位指( BCE )
A在国民经济中作用重要的单位
B标志值在总体标志总量中所占比重比较大的单位
C全部单位中的一小部分单位
D在国民经济中地位显赫的单位
E能反映总体基本情况的单位
5.下列应该用几何平均法计算的有( BCE )
A 生产同种产品的三个车间的平均合格率
B 平均发展速度
C 前后工序的三个车间的平均合格率
D 平均劳动生产率
E 以复利支付利息的年平均利率
四、计算题(每小题10分,共计30分)
1考虑一个n=4次实验和成功概率 =0.5的二项实验。
(1)利用二项概率分布公式求x=0,1,2,3和4的概率,并画出概率分布图。
(2)求x小于2的概率。
(3)求x小于或等于2的概率。
(4)验证x=0,1,2,3和4的概率之和等于1 (允许有四舍五入的误差)。
答:(1))利用二项概率分布公式,分别求得:
p(x=0)=0.0625,p(x=1)=0.25,p(x=2)=0.375,p(x=3)=0.25,p(x=4)=0.0625
直方图
(2)p(x<2)=0.3125
(3)p(x=<2) 0.6875
(4)
2某厂生产彩色电视机,按不重复抽样方法从一批出厂产品中抽取1%的产品进行质量检验,取得如下资料:
(1)试计算抽样平均误差。
(2)给出电视机使用寿命95%的置信区间。
(3)如果规定彩色电视机的正常工作时间在12 000小时以上为一级品,试对该厂这批出厂产品的一级品率作出95%的置信区间估计。
正常工作时间
(千小时) | 电视机(台) |
6-8 8-10 10-12 12-14 14-16 | 15 30 50 40 9 |
合计 | 144 |
样本标准差S=4.615
抽样平均误差
(3)P=(40+9)/144=34%
根据以下公式:,得置信区间[26.302%,41.698%]
即该厂生产的彩色电视机的一级品率在26.302% - 41.698%之间。
3.对某型号电子元件10000只进行耐用性能检查。根据以往抽样测定,求得耐用时数的标准差为600小时。试求在重复抽样条件下:
(1)概率保证程度为68.27%,元件平均耐用时数的误差范围不超过150小时,要抽取多少元件做检查?
(2)根据以往抽样检验知道,元件合格率为95%,合格率的标准差为21.8%,要求在99.73%的概率保证下,允许误差不超过4%,试确定重复抽样所需抽取的元件数目是多少?如果其他条件均保持不变,采用不重复抽样应抽取多少元件做检查?
答: (1)概率保证程度为68.27%,元件平均耐用时数的误差范围不超过150小时,要抽取的元件数:
根据公式
(2)重复抽样所需抽取的元件数目:
根据公式
采用不重复抽样应抽取的元件数
根据公式
既要推断电子元件的平均耐用时数,采用不重复抽样或重复抽样均至少要抽16件进行调查(t=1);要推断电子元件的合格率,采用重复抽样需抽取268件进行调查,采用不重复抽样需抽取261件进行调查(t=3)。
《统计学》第三阶段练习题
一 、单项选择题(共20小题,每小题2分,共计40分)
1.在方差分析中,如果拒绝原假设,则说明 ( A )
A 自变量对因变量有显著影响
B 所检验的各总体均值之间全部相等
C 不能认为自变量对因变量有显著影响
D 所检验的各样本均值之间全不相等
2.在单因素分析中,用于检验的统计量F的计算公式为 ( C )
A SSA/SSE B SSA/SST C MSA/MSE D MSE/MSA
3.在单因素分析中,如果不能拒绝原假设,那么说明组间平方和SSA ( C )
A 等于0
B 等于总平方和
C 完全由抽样的随机误差所决定
D 显著含有系统误差
4.SSA自由度为 ( A )
A r-1 B n-1 C n-r D r-n
5.方差分析中的多重比较是通过配对来进一步检验 ( A )
A 哪两个总体均值之间有差异 B 哪两个总体方差之间有差异
C 哪两个样本均值之间有差异 D 哪两个样本方差之间有差异
6.加权调和平均指数,其权数是( A)
A q1p1 B q1p0 C q0p0 D q0p1
7.某工厂总生产费用,今年比去年上升了50%,产量增加了25%,则单位成本提高了( D )
A25% B2% C75% D20%
8.某地居民以相同的金额在报告期购买的商品数量比基期少11.8%,则该市的物价指数为( B )。
A.118% B.113.38%
C.88.2% D.120%
9.下列各项中属于质量指标指数的是( B )
A产量指数 B单位成本指数
C销售量指数 D职工人数指数
10.一般说,当居民的收入减少时,居民的储蓄款也会相应减少,二者之间的关系是( A )
A正相关 B负相关 C零相关 D曲线相关
11.在相关分析中,若变量X的值增加时,变量Y的值随之减少,则这两个变量间的关系是( B)。
A.正相关 B.负相关
C.复相关 D.不相关
12.在进行一元线性回归模型的估计中采用了( D )方法。
A.移动平均法 B.部分平均法
C.指数平滑法 D.最小二乘法
13.回归估计的估计标准误差的计量单位与( B )相同。
A自变量 B因变量 C两个变量 D相关系数
14.2011年我国高速公路总长达到1.9万公里,和2008年相比几乎翻了二番。“翻二番”表示( D )
A.2001年公路总规模
B.是以2001年为标准计算的相对数
C.2001年公路长度是1998年的2倍
D.2001年公路长度比1998年增加了3倍
15. 某企业2012年的产值比2008年增长了200%,则年平均增长速度为( C )
A B、 C D、
16.从一批轮胎中随机抽取16个轮胎检测其平均使用寿命为12740公里,样本标准差为450公里。若轮胎使用寿命12000公里以上为合格,若进行假设检验判断本批次轮胎使用寿命是否合格,则构造原假设H0为( C )
A B、 C D、以上都不对
17. 从一批轮胎中随机抽取36个轮胎检测其平均使用寿命为12740公里,样本标准差为450公里。若轮胎使用寿命12000公里以上为合格,若进行假设检验判断本批次轮胎使用寿命是否合格,则构造统计量为( B )
A B、
C D、
18.在样本不变的情况下,假设检验中,两类错误的关系是( C )
A同时增加
B同时减小
C第一类错误增大,第二类错误必然减小,反之亦然
D没有确定的关系
19.在线性回归模型y=a+bx中,b的含义是( A )
A x每增加一个单位,y绝对值增加b个单位
B y每增加一个单位,x绝对值增加b个单位
C x每增加1%,y增加b%
D y每增加1%,x增加b%
20.在双对数回归模型lny=a+blnx中,b的含义是( C)
A x每增加一个单位,y绝对值增加b个单位
B y每增加一个单位,x绝对值增加b个单位
C x每增加1%,y增加b%
D y每增加1%,x增加b%
二 判断题(共10小题,每小题2分, 共计20分)
1.在进行相关和回归分析时,必须以定性分析为前提,判定现象之间有无关系及其作用范围。( T )
2.回归系数b的符号与相关系数r的符号,可以相同也可以不相同。 ( F )
3.在直线回归分析中,两个变量是对等的,不需要区分因变量和自变量。 ( F )
4.相关系数r越大,则估计标准误差S值越大,从而直线回归方程的精确性越低。( F )
5.进行相关与回归分析应注意对相关系数和回归直线方程的有效性进行检验。( T )
6.假设检验中的p值越小,说明原假设成立的可能性越小。( T )
7.单尾检验中,若原假设H0:,总体正态分布条件下给定显著性水平,则拒绝域是( T )
8.指数按其反映对象范围的不同,分为个体指数和总指数。( T )
9.加权算术平均数受两个因素的影响,一个是分配数列中变量水平;另一个是结构即权重。( T )
10.在一个指数数列中,指数按对比基期的不同,分为定基指数和环比指数。( T )
三 多项选择题(共5小题,每小题2分,共计10分)
1.在直线相关和回归分析中( AD )
A据同一资料,相关系数只能计算一个
B据同一资料,相关系数可以计算两个
C据同一资料,回归方程只能配合一个
D据同一资料,回归方程随自变量与因变量的确定不同,可能配合两个
E回归方程和相关系数均与自变量和因变量的确定无关
2.相关系数r的数值( ABDE )
A可为正值 B可为负值 C可大于1
D可等于--1 E可等于1
3.相关系数r = 0.9,这表明现象之间存在着( AD )
A高度相关关系 B低度相关关系
C低度负相关关系 D高度正相关关系
E低度正相关关系
4.相关系数,│r│的大小与估计标准误差S值的大小表现为( CE )
A变化方向一致 B各自完全变化
C变化方向相反
D时而发生一致变化,时而又发生反向变化
E二者都受σy大小的影响
5.确定直线回归方程必须满足的条件是( ACDE )
A现象间确实存在数量上的相互依存关系
B相关系数r必须等于1
C相关现象必须均属于随机现象
D现象间存在着较密切的直线相关关系
E相关数列的项数必须足够多
四 计算题(每小题10分,共计30分)
1.已知某炼铁厂的含碳量服从正态分布N(4.55,0.1082),现在测定了9炉铁水,其平均含碳量为4.484。如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为4.55?(α=0.05)
答:μ0=4.55 σ=0.108 n=9 平均数=4.484
AH0:μ=4.55 H1:μ≠4.55
B Z=(4.484-4.55)/0.108/3=-1.833
C取α=0.05 查表得:-Zα/2=-Z0.025=-1.96
D因为︱Z︱<︱Zα/2︱
所以接受H0,即可以认为生产的铁水平均含碳量为4.55.
2. 调查了339名50岁以上的人,其中205名吸烟者中有43人患慢性气管炎,在134名不吸烟者中有13人患慢性气管炎。调查数据能否支持“吸烟者容易患慢性气管炎”这种观点?(α=0.05)
答:H0:P1-P2≤0 H1:P1-P2>0
Z==2.9606
取α=0.05 查表得Zα=Z0.05=1.5
因为Z > Zα
所以拒绝H0,即吸烟者容易患慢性气管炎。
3. 某地高校教育经费(x)与高校学生人数(y)连续6年的统计资料如下:
教育经费(万元)x | 在校学生数(万人)y |
316 343 373 393 418 455 | 1l 16 18 20 22 25 |
⑴建立回归直线方程,估计教育经费为500万元的在校学生数;
(2)计算估计标准误差。
答:
教育经费x | 在校学生数y | xy | x2 | y2 |
316 | 11 | 3 476 | 99 856 | 121 |
343 | 16 | 5 488 | 1179 | 256 |
373 | 18 | 6 714 | 139 129 | 324 |
393 | 20 | 7 860 | 154449 | 400 |
418 | 22 | 9 196 | 174724 | 484 |
455 | 25 | 11 375 | 207 025 | 625 |
2298 | 112 | 44 109 | 2 832 | 2 210 |
b=(6×44109-2298×112)/(6×2832-22982)=0.0955
a=112/6-0.0955×2298/6=-17.91
所以y=-17.91+0.0955x
在教育经费为500万元时,在校学生数为:
y=-17.91+0.0955×500=29.84(万人)
(2)计算估计标准误差
Syx=0.76(万人)