1、标志是( C )。
A说明总体数量特征的名称B都可用数量表现的特征的名称
C说明总体单位特征的名称D不能用数量表现的特征的名称
2、社会经济统计的研究对象是( A )。
A大量社会经济现象的数量方面 B主要社会经济现象
C大量社会经济现象的方面 D个别典型事物
3、考生《统计学原理》的考试成绩分别为:60分、68分、75分、82分、90分。这五个数是( D )。
A指标 B标志 C变量 D标志值
4、几何平均数是一数列标志值的( B )
A连加和除以项数的商 B连乘积的项数方根
C连加和的项数方根 D连乘积除以项数的商
5、有下列资料:
产量(件) 10 11 12 13 14 15
人数(人) 5 10 20 8 5 2
众数是( A )。
A 12件 B 20人 C 14人 D 12.5件
6、有下列资料:75、78、80、82、87、90;其中位数是( B )。
A 80 B 81 C 82 D 85
7、测定标志变动的最基本最重要的指标是( C )。
A全距 B 平均差 C 标准差 D 标准差系数
8、标准差是变量数列中各变量值与其平均数的( D )。
A离差平均数 B离差绝对值的平均数
C 离差平方和的平均数 D离差平方和的平均数的平方根
9、抽样误差的大小( C )。
A既可以避免,也可以控制 B既不能避免,也不能控制
C只能控制,但不可避免 D只能避免,但不可控制
10、抽样推断必须遵循的原则( A )。
A随机原则 B一致性原则 C可靠性原则 D准确性原则
11、区间估计时,若概率把握程度提高,则( A )
A估计的区间会增大 B估计区间会减少
C抽样平均误差会增大 D抽样平均误差会减少
12、用最小方法配合直线趋势,如果y=a+bx中,b为负数,则这条直线呈( B ).
A上升趋势 B下降趋势 C不升不降
D或上升、或下降、或不升不降
13、当直线回归方程中的参数b=0时,有( B )。
A r=-1 B r=0 C r=1 D r无法确定
14、、回归分析时( A )。
A 必须准确的区分自变量和因变量 B 回归系数必须是正整数
C 方程中的两个变量是随机变量 D 回归方程中只有自变量是随机变量
15、相关分析中( C )。
A 相关系数可用于曲线相关 B 相关指数不能用于直线。
C 相关指数既可用于直线相关,也可用于曲线相关
D 相关指数只能用于曲线相关
16、相关系数的取值范围( B )。
A 0≤r≤1 B -1≤r≤1 C |r|>0 D 1≤|r|≤0
17、相关分析可以( D )。
A 判断现象之间的因果关系 B 说明相关关系产生的原因
C 推断预测 D 用数量表示现象之间相关关系的密切程度
18、函数关系与相关关系的主要区别在于( B )。
A两个相互依存变量联系能否用数学模型来表示
B两个相互依存变量间的联系在数量上是否确定
C两个相互依存变量间的联系是否是确实存在
D 两个相互依存的变量是否是社会经济现象
19、在相关分析中,要求相关两个变量( A )。
A都是随机变量 B都不是随机变量
C只有因变量是随机变量 D只有自变量是随机变量
20、单位成本与产品产量之间的关系是( B )。
A函数关系 B相关关系 C正相关 D不相关
21、在回归直线=a+bx中,b表示( A)。
A 当x增加一个单位时,y增加a的数量
B当y增加一个单位时,x增加b的数量
C当x增加一个单位时,y的平均增加量
D当y增加—个单位时,x的平均增加量
22、某种商品的价格与其销售量的关系如下
价格 | 1.00 | 0.95 | 0.90 | 0.80 | 0.75 | 0.70 |
销售量 (千克) | 200 | 210 | 218 | 230 | 240 | 270 |
A -1.21 B 1.30 C 0.72 D -0.97
二、填空:
1、统计研究过程可分为:( 统计设计) 、( 统计调查 )、( 统计整理 )和( 统计分析 )。
2、从方法的功能来看,统计学可分为( 描述统学 )和( 推断统计学 )。
3、统计数据的来源于两种渠道:一是来源于( 直接的调查和科学实验),称为直接来源;二是来源于别人的调查和实验数据。
4、数据的搜集方法有( 询问调查 )和( 观察实验 )两大类。
5、统计数据的预处理是数据分组整理的先前步骤,内容包括数据的( 审核 )、( 筛选)、( 排序 )等过程。
6、计算平均数所使用的权数,既可以是次数,也可以是(频数)。
7、抽样方法有(有放回抽样)和(无放回抽样 )。
8、一个估计量满足(无偏性)、(一致性)、(有效性),则该统计量就是最优估计量。
9、时间序列可以分为(平稳序列)和(非平稳序列 )两大类。
10、如果原有总体服从正态分布N(,)时,那么样本均值也服从正态分布,服从正态分布N((,) 。
11、即使是从非正态分布的总体进行抽样,只要样本容量n足够大,样本平均数也趋向于(正态分布 )。
12、统计量是样本的函数,用来估计( 总体参数 )。
13、回归直线必须通过的点是()。
14、总离差是由(回归平方和 )平方和与(残差平方和)平方和两部份组成。
15、相关系数r==1时,两现象为正或负的( 完全相关 ),相关系数时( 0),两现象之间为完全不相关。
三、计算(每题10分)
1、人的身高服从正态分布N(,),从大一男生中随机抽取9名,测得身高如下(单位:厘米):169、173、183、170、165、172、178、163、158。
1)如果已知大一男生身高的方差=40,求大一男生平均身高的置信区间。(=5%、)
1、解:
1)
则
则大一男生的身高在置信度为95%下的置信区间为
2)如果身高的方差未知,求大一男生身高的置信区间。(经计算,样本标准差=7.62,)
2)因为未知,由样本数据计算得样本标准差=7.62,
则大一男生的身高在置信度为95%下的置信区间为
2、从某罐头厂仓库采用纯随机不重复抽样从10000瓶抽取100瓶罐头,平均每罐重量为243克,样本标准差为10克。以90%的可靠程度估计该批罐头平均每罐重量的区间范围。()
2、由于总体方差未知,但是大样本,可以用样本方差S代替。
241.36
244.65
则,以90%的可靠程度估计该批罐头平均每罐重量的区间范围为(241.36,244.65)
3、由统计资料得知,2008年某地新生儿的平均体重为3190克,现在从2009年的新生儿中随机抽取100个,测得其平均体重为3210克,问2009年的新生儿与2008年相比,体重有无显著差异?(假设新生儿体重的标准差为80克,显著性水平为0.05,)
3、解:首先提出原假设和备选假设:
因为总体方差已知,且是大样本,所以采用Z统计量:。
由于,,
代入得:
因为大于
所以,拒绝原假设,接受原假设。
即认为2009年的新生儿与2008年相比,体重有显著差异。
4、根据一组数据建立的线性回归方程.要求:
1)解释斜率的意义。
2)当=6时的E(y)
4、
1)斜率的意义在于:自变量X变化对Y影响程度。回归方程中,当x增加一个单位时,y将减少0.5个单位。
2)x=6时,代入方程,则,y=10-0.5 6=7
5、若机床的使用年限和维修费用相关,有如下资料:
x机床使用年限 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
y维修费用 | 10 | 14 | 18 | 20 | 25 | 28 | 30 | 40 |
2)建立回归方程并说明回归系数的经济意义
5、
1)散点图略。
x与y呈现线性关系。
2)设回归方程为
则
所以,线性回归方程为:y=5.7+3.86x.
由以上回归方程知道,机床每增加一年的使用时间,维修费约增加3.68个单位。
四、简答
1、简述参数最小二乘估计的基本原理。
2、一元线性回归模型中关于随机项的基本假定。
3、在回归分析中,F检验和t检验各有什么用?
4、相关分析和回归分析的区别与联系
四、简答
1、估计线性回归方程,即寻找一条最能拟合观测值的直线。假设该直线为:,若该直线上的点与真实观测值的总误差最小,即最小,那么,该直线就是最能拟合观测值的回归直线。
2、
1)随机项的数学期望为0,即,
2)随机项的方差相同,即
3)随机项不相关。即
4)随机项与自变量无关。即
3、t检验用来检验方程中变量系数的显著性,t值大于临界值时,认为系数显著地不为0,则说明自变量对因变量的影响显著。
F检验用来检验方程的线性显著性。F值大于临界值时,则说明方程的线性关系显著。
4、1)联系:相关分析是回归分析的前提,回归分析是建立在相关分析基础之上的。
2)区别:a,相关分析中,两个变量都是随机变量,不必区分自变量和因变量;
回归分析研究的是一个随机变量Y与另一个非随机变量X之间的关系,且变量之间必须区分自变量和因变量。
b,相关系数只能观察变量之间的相关关系的密切程度和方向。而回归分析可以根据回归方程,用自变量数值推算因变量的估计值。