
考试课程:统计学
试卷类别:A卷□
√ B卷□考试形式:闭卷□√开卷□
适用专业年级:2011级金融学、国际贸易学、保险学专业
注明:试卷答案请做在答题纸上。
一、单选题(每题1分,共30分,30%)
1. 下列不属于描述统计问题的是()
A根据样本信息对总体进行的推断B了解数据分布的特征
C分析感兴趣的总体特征D利用图,表或其他数据汇总工具分析数据
2. 根据样本计算的用于推断总体特征的概括性度量值称作()
A.参数 B. 总体C.样本 D. 统计量
3. 通过调查或观测而收集到的数据称为()
A.观测数据 B. 实验数据
C.时间序列数据 D. 截面数据
4. 从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()。
A.重复抽样
B.不重复抽样
C.分层抽样
D.整群抽样
5. 调查时首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。这样的调查方式称为()。
A 系统抽样
B 整群抽样
C 滚雪球抽样
D 判断抽样6. 下面的哪一个图形最适合于描述结构性问题()
A.条形图
B.饼图
C.雷达图
D. 直方图
7. 对于大批量的数据,最适合描述其分布的图形是( )
A.条形图
B.茎叶图
C.直方图
D.饼图
8. 将某企业职工的月收入依次分为2000元以下、2000元~3000元,3000元~4000元、4000元~5000元、5000元以上几个组。最后一组的组中值近似为( )
A.5000
B.7500
C.5500
D.6500
9. 下列关于众数的叙述,不正确的是()
A.一组数据可能存在多个众数
B.众数主要适用于分类数据
C.一组数据的众数是唯一的
D.众数不熟极端值的影响
10. 一组数据的最大值与最小值之差称为()
A.平均数
B.规范差
C.极差
D.四分位差
11.如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=3,其意义是()
A.至少有75%的数据落在平均数加减3个规范差的范围之内
B. 至少有%的数据落在平均数加减3个规范差的范围之内
C.至少有94%的数据落在平均数加减3个规范差的范围之内
D. 至少有99%的数据落在平均数加减3个规范差的范围之内
12. 下列不是次序统计量的是()。
A. 中位数
B. 均值
C. 四分位数
D. 极差
13. 根据中心极限定理可知,当样本容量无限大时,样本均值的抽样分布服从正态分布,其分布的方差为()。
A. B.
C. D.
14. 大样本的样本比例之差的抽样分布服从( )
A .正态分布
B .t 分布
C .F 分布
D .开方分布
15. 在参数估计中,要求通过样本的统计量来估总体参数,评价统计量的规范之一是使它与总体参数的离差越小越好。这种评价规范称为( )
A .无偏性
B .有效性
C .一致性
D .充分性
16. 当正态总体的方差未知时,在小样本条件下,估计总体均值使用的分布是( ) A.正态分布 B.t 分布 C.2χ分布 D.F 分布
17.
对于非正态总体,使用统计量X z μ
-=估计总体均值的条件是()
A.小样本
B.总体方差已知
C. 总体方差未知
D.大样本
18. 从一个正态总体中随机抽取一个容量为n 的样本,其均值和规范差分别为33和4.当n=5时,构造总体均值U 的95%的置信区间为( )
A .33±4.97 B. 33±2.22 C. 33±1.65 D. 33±1.96 19. 在假设检验中,不拒绝原假设意味着( ) A 、原假设肯定是正确的
B 、原假设肯定是错误的
C 、没有证据证明原假设是正确的
D 、没有证据证明原假设是错误的 20. 指出下列假设检验那一个属于右侧检验( ) A 、H 0:μ= μ0,H 1:μ≠μ0B 、H 0:μ≥μ0,H 1:μ<μ0 C 、H 0:μ≤μ0,H 1:μ>μ0D 、H 0:μ>μ0,H 1:μ≤μ
21. 从正态总体中随机抽取一个n=25的随机样本,计算得到x =231.7,s=15.5,假定20σ=50,在α=0.05的显著性水平下,检验假设0H :2σ≥20,21:σH <20,得到的结论是( ) A.拒绝0H B.不拒绝0H
C.可以拒绝也可以不拒绝0H
D.可能拒绝也可能不拒绝0H 22. 检验两个总体的方差比时所使用的分布为( )。
A.正态分布
B.t 分布
C. χ2分布
D.F 分布 23.列联分析是利用列联表来研究( )。
A .两个分类变量的关系
B .两个数值型变量的关系
C .一个分类变量和一个数值型变量的关系
D .两个数值型变量的分布 24. 组间误差是衡量不同水平下各样本数据之间的误差,它( )
A .只包括随机误差
B .只包括系统误差
C .既包括随机误差,也包括系统误差
D .有时包括随机误差,有时包括系统误差
25. 有交互作用的双因素方差分析是指用于检验的两个因素( )。
A .对因变量的影响是的
B .对因变量的影响是有交互作用的
C .对自变量的影响是的
D .对自变量的影响是有交互作用的 26. 下面的陈述哪一个是错误的( )
A . 相关系数是度量两个变量之间线性关系强度的统计量
B . 相关系数是一个随机变量
C . 相关系数的绝对值不会大于1
D . 相关系数不会取负值
27. 由最小二乘法得到的回归直线,要求满足因变量的( ) A.平均值与其估计值的离差平方和最小
B.实际值与其平均值的离差平方和最小
C.实际值与其估算值的离差和为0
D.实际值与其估计值的离差平方和最小
28.时间序列在一年内重复出现的周期性波动称为( )。 A .趋势 B .季节性 C .周期性 D. 随机性 29. 移动平均法适合于预测( )
A .平稳序列 B.非平稳序列 C.有趋势成分的序列 D.有季节成分的序列
A. 趋势直线
B. 修正指数曲线
C. Gompertz曲线
D. 二次曲线
二、判断题(每题1分,共10分,10 %。正确的打√,错误的打Χ
1. 总体回归函数中的回归系数是常数,样本回归函数中的回归系数的估计量是随机变量。()
2. 在假设检验中如显著性水平降低,意味着拒绝域扩大化。()
3. 假设检验中,犯第Ⅱ类错误的真实概率就是P值(P-value)。()
4. 某班学生的年龄分布是右偏的,均值为22,规范差为4.4
5.如果采取重复抽样的方法从该班抽取容量为100的样本,则样本均值的抽样分布是正态分布,均值为22,规范差为0.445。()
5. 一组数据的众数是唯一的。()
6. 为了调查某校学生的购书费用支出,将全校学生名单按拼音顺序排列后,每隔50个名学生抽取一名学生进行抽查,这种调查方法是整群抽样。()
7.进行方差分析时,对数据有4个基本的假定,即正态性、方差齐性、性和一致性。()
8.在一元线性回归分析中,估计规范误差是残差平方和的均方根。()
9. 经验法则表明,当一组数据对称分布时,在平均数加减2个标注差的范围之内大约有95﹪的数据。()
10.假设总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布也服从均匀分布。()三、名词解释(每题3分,共15分,15%)
1. 比率(ratio)
2. 分层抽样(stratified sampling)
3. 方差(variance)
4. 区间估计(interval estimate)
5. 原假设(null hypothesis)
四、简答题(每题5分,共20分,20 %)
1.鉴别图表优劣的准则有哪些?
2. 什么是假设检验中的第一类和第二类错误?是否有可能同时降低两类错误的可能性?
3.什么是回归分析中的随机误差项和残差?它们之间的区别是什么?
4.简述时间序列的构成要素。
五、计算题(1、2、3题各5分,第4题10分,共25分,25 %)
1. 从一个规范差为5的总体中采用重复抽样方法抽出一个样本为40的样本,样本均值为25。
(1)样本均值的规范差X
等于多少?(2分)
(2)在95%的置信水平下,估计差是多少?(3分)
2. 某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50袋,发现有6袋低于250克。若规定不符合规范的比例超过5%就不得出厂,问该批食品能否出厂(a=0.05)?
3. 某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果:
装 方差分析表 要求:
(1)完成上面的方差分析表。(3分)
(2)若显著水平α=0.05,检验三种方法组装的产品数量之间是否有显著差异。(2分)
请完成
(1)写出Excel 的基本步骤并完成上述表内的df ,MS 的值。(3分) (2)建立回归方程,并解读该方程。(3分)
(3)计算残差、判定系数R 2、估计规范误差S e ,并分析回归方程的拟合程度。(4分)
2012—2013学年第二学期闽江学院考试试卷答题纸
考试课程: 统计学
试卷类别:A 卷☑ B 卷□ 考试形式:闭卷☑ 开卷□
适用专业年级:2011级金融学、国际贸易学、保险学专业 回归统计
Multiple R
0.968167 R Square
0.937348 Adjusted R Square 0.9163 规范误差 3.809241
观测值
5
方差分析
df
SS
MS
F
Significance F 回归分析 ( ) 651.2691 ( ) 44.88318 0.006785216 残差 ( ) 43.53094 ( )
总计 4 694.8
Coefficients 规范误差 t Stat P-value
Lower 95% Upper 95% 下限 95.0% 上限 95.0%
Intercept 13.62541 4.399428 3.097086 0.053417 -0.375535222 27.62635 -0.37554 X Variable 1 2.302932 0.343747 6.699491 0.006785 1.2074424 3.3968 1.2074
1. 比率(ratio):
2. 分层抽样(stratified sampling ):
3. 方差(variance):
4. 区间估计(interval estimate ):
5. 原假设(null hypothesis ):
1.鉴别图表优劣的准则有哪些?
2. 什么是假设检验中的第一类和第二类错误?是否有可能同时降低两类错误的可能性?
4.简述时间序列的构成要素。
2.
2012—2013学年第二学期
闽江学院考试试卷参及评分规范
考试课程:统计学
试卷类别:A卷□√ B卷□考试形式:闭卷□√开卷□
适用专业年级:2011级金融学、国际贸易学、保险学专业
1.比率(ratio):一个样本(或总体)中各不同类别数据之间的比值。
2.分层抽样(stratified sampling):也称分类抽样,在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元
素组成一个样本。
3. 方差(variance):各数据与其平均数离差平方的平均数。
4. 区间估计(interval estimate ):在点估计的基础上,给出总体参数估计的一个估计区间,该区间通常由样本统计量加减估计误差组成。
5. 原假设(null hypothesis ):又称零假设,研究者想收集证据予以推翻的假设,用H0 表示,它所表达的是参数没有变化或变量之间没有关系。
答:(1)精心设计,有助于洞察问题的实质;(1分)
(2)使复杂的观点得到简明、确切、高效的阐述;(1分)
(3)能在最短的时间内,以最少的笔墨给读者提供最大的信息;(1分) (4)是的;(1分)
(5)表述数据的真实情况。(1分)
2. 什么是假设检验中的第一类和第二类错误?是否有可能同时降低两类错误的可能性?
答:在统计检验中:原假设是真实的,却拒绝原假设称作假设检验的“第一类错误”(1.5分)。原假设是不真实的,判断结论却接受原假设,这是“第二类错误”(1.5分)。
在样本一定条件下,犯第二类错误的概率β与犯第一类错误的概率α相互之间呈反向变动关系。但是通过增大样本容量,减小抽样分布的离散性,有可能同时降低两种错误的概率(2分)。
3.什么是回归分析中的随机误差项和残差?它们之间的区别是什么?
答:随机误差项εt 反映除自变量外其他各种微小因素对因变量的影响。它是Yt 与未知的总体回归线之间的纵向距离,是不可直接观测的。(2.5 分)。
残差et 是Yt 与按照回归方程计算的t
Y ˆ的差额,它是Yt 与样本回归线之间的纵向距离,当根据样本观测值拟合出样本回归线之后,可以计算出et 的具体数值。利用残差可以对随机误差项的方差进行估计。(2.5分) 4.简述时间序列的构成要素。
答:时间序列构成要素有四种,它们是趋势(T )、季节变动(S )、周期性或循环波动(C )和不规则波动(I )(2分)。
(1)趋势也称为长期趋势,是指时间序列在长时期内呈现出来的某种持续向上或持续下降的变动。它是由某种固定性的因素作用于序列而形成的。它可以是线性的,也可以是非线性的。(1分)
(2)季节变动是指时间序列在一年内重复出现的周期性波动。(1分) (3)循环波动或周期性波动是指时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动。它不同于趋势变动,不是朝着单一的方向持续运动,也不同于季节变动,季节变动有比较固定的规律,且变动周期为一年,而循环波动则无固定的规律,变动周期多为一年以上,且周期长短不一。周期性通常是由于经济环境的变化而引起的。随机性或不规则波动是由于一些偶然性的因素产生的。(1分)
本均值为25。
(1)样本均值的规范差X σ等于多少? (2)在
95%的置信水平下,估计差是多少?
解:已知5σ
=,n=40,0.05/225,0.05, 1.96x z α===.(1分) (1
)样本均值的抽样规范差0.79
x σ=
=
= (2分) (2)边际误差E=/2
z α=1.96⨯=1.55 (2分)
2. 某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50袋,发现有6袋低于250克。若规定不符合规范的比例超过5%就不得出厂,问该批食品能否出厂(a=0.05)? 解:
00.055%,0.05, 1.5z πα=== (1分)
假设:(1分)
010.05
:5%,:5%6
5%
2.27H H Z Z ππ≤>-=
=> (2分) 拒绝原假设,该批食品不能出厂。(1分)
3. 某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果:
要求:
(1)完成上面的方差分析表。(3分)
(2)若显著水平α=0.05,检验三种方法组装的产品数量之间是否有显著差异。(2分)
解:(1)方差分析表中所缺的数值如下表:
F=1.478 我们可以通过Excel 获得: 请完成 (1)写出Excel 的基本步骤并完成上述表内的df ,MS 的值。(3分) (2)建立回归方程,并解读该方程。(3分) (3)计算残差平方和、判定系数R 2、估计规范误差S e ,并分析回归方程的拟合程度。(4分) 方差分析 df  SS  MS  F Significance F 回归分析 (    ) 651.2691 (     ) 44.88318 0.006785216 残差 (     ) (      ) (     )      总计 4 694.8 Coefficients  规范误差 t Stat  P-value  Lower 95% Upper 95% 下限 95.0% 上限 95.0% Intercept  13.62541    4.399428 3.097086 0.053417 -0.375535222 27.62635 -0.37554 27.62635 X Variable 1    2.302932 0.343747 6.699491 0.006785 1.2074424 3.3968    1.2074 3.3968          回归统计 Multiple R 0.968167 R Square 0.937348 Adjusted R Square  0.9163 规范误差 3.809241 观测值 5 (1)Excel的步骤 第一步,选择Excel中【工具】下拉菜单,并选择【数据分析】选项。 第二步,在分析工具中选择【回归】,然后单击【确定】。 第三部,当对话框出现时: 输入X、Y值的区域位置,在输出区域选择输出区域 在残差项中选择残差、规范残差。 单击【确定】 回归分析的df=1,MS=651.27,残差的df=3,MS=14.5 (2)由Excel结果我们可建立回归方程为ˆ13.6254   2.3029 =+,回归系数表明, y x x每增加1个单位,y平均增加2.3029个单位; (3)残差平方和=43.53094,判定系数R2=93.74%,表明回归方程的拟合度较高; =3.8092,表明用x来预测y时平均的预测误差为3.8092。 估计规范误差S e
