一、单项选择题(下列各题中,只有一个符合题意的正确答案,将正确的答案填入括号中。每小题3分,共30分)
1、上、下四分位数在数据中所处的位置分别是( )。
A、25%,50% B、25%,75% C、50%,25% D、75%,25%
2、在小样本的情况下,如果总体不服从正态分布,且总体方差未知,则经过标准化的样本均值服从( )。
A、Z分布 B、t分布 C、分布 D、F分布
3、箱图是由一组数据的( )个特征值绘制而成的。
A、5 B、4 C、3 D、2
4、两个配对样本T检验的前提要求:( )
A、两个样本应是配对的
B、样本来自的两个总体应服从标准正态分布
C、两个样本应是配对的并且样本来自的两个总体应服从同一分布
D、两个样本应是配对的并且样本来自的两个总体应服从正态分布
5、相关系数的取值范围是( )。
A、-1≤r≤0 B、0≤r≤1 C、-1≤r≤1 D、-1<r<1
6、某连续变量取值分为五组:第一组为40~50,第二组50~60,第三组为60~70,第四组为70~80,第五组为80以上。习惯上规定( )。
A、50在第一组,70在第四组 B、60在第二组,80在第五组
C、70在第四组,80在第五组 D、80在第四组,50在第二组
7、方差分析解决的基本问题:( )
A、两个总体均值是否相等的检验问题
B、多个总体均值是否相等的检验问题
C、两个总体方差是否相等的检验问题
D、多个总体方差是否相等的检验问题
8、某公司报告期产量比基期增长了15%,生产费用增长了9%。则单位产品成本是( )。
A、降低了67% B、降低了5.2% C、降低了40% D、降低了6%
9、当需要输出5个最大值与5个最小值时,需选用( )
A.Descriptives B.M-estimators C.Outliers D.Percentiles
10. 在方差分析中,随机误差( )。
A、只存在于组内方差中
B、只存在于组间方差中
C、既存在于组内方差,又存在于组间方差中
D、是由系统性因素造成的
二、填空题(将正确的答案填入横线,每空1分,共10分)
1、Wilcoxon序号和检验法适合于 样本。
2、刻度级数据之间非要分析相关关系,必须选择 。
3、234、279、225、212,它们的茎节宽度应取为 。
4、箱形图数据仅适用于 的样本数据。
5、Power estimation:转换幂值估计,表示对每一组数据产生一个 范围的自然对数与 范围的自然对数的散点图。
6、Somers’D值,取值范围 。
7、Nominal by Internal适用于一个为 ,另一个为 的相关性检验。
8、McNemar只适用 。
三、名词解释(每小题5分,共20分)
1、判定系数
2、茎叶图
3、游程
4、估计标准误差
四、判断题(在每小题后面的括号内填入判断结果,正确的用“√”表示,错误的用“×”表示。每小题2分,共10分)
1、如果数据分布右偏,则其众数最小,均值最大。( )
2、在大样本的情况下,即使总体不服从正态分布,样本均值也服从正态分布。( )
3、在假设检验中,当备择假设H1为真时作出接受原假设H0的判断,则犯了弃真错误。( )
4、如果样本相关系数很高,则总体相关系数也必定很高。( )
5、如果两变量的相关系数等于0,说明它们之间不存在相关关系。( )
五、计算与案例分析(每小题15分,共30分)
1、某汽车制造厂销售部经理认为,汽车的销售量与广告费用之间存在着密切的关系。为此,该经理收集了12个汽车销售分公司的有关数据如下:
汽车销售量(辆) | 广告费(万元) |
1000 1100 1250 1280 1360 1480 1500 1720 1800 10 2100 2200 | 357 385 420 406 490 525 602 651 735 721 840 924 |
一、方差分析表
df | SS | MS | F | Significance F | |
回归分析 | 1 | 1602709 | 1602709 | 399.1_ | 2.17E-09 |
残差 | 10 | 40158.07 | 4015.807 | ||
总计 | 11 | 12867 |
Coefficients | 标准误差 | t Stat | P-value | |
Intercept | 363.61 | 62.45529 | 5.823191 | 0.000168 |
X Variable 1 | 2.028873 | 0.101558 | 19.97749 | 2.17E-09 |
(1)计算销售量与广告费用之间的相关系数,并据此分析两者的关系形态与强度;
(2)写出销售量对广告费用的一元线性回归方程,并检验在5%的显著性水平下,回归系数和回归方程的线性关系是否显著。
2、样本数据集合(排序后)为1,3,5,7,9,13,15,17,18,20,23,试计算该数据集合的下、上四分点和中位数的值。
管理统计学参:
一、单选
1-5. DBADC 6-10. CBBCC
二、填空题
1. 两个
2. 列联系数
3. 10
4. 刻度级
5. 中位数 四分位数
6. 【-1,1】
7. 名义变量 等距变量
8. 二值变量
三、名词解释
1、判定系数:是回归平方和占总变差平方和的比例,它测定了回归直线对观测数据的拟合程度,它的实际意义是:在因变量y取值的总变差中可以由自变量x取值所解释的比例,它反映了自变量对因变量取值的决定程度。
2、茎叶图:是一种用来展示原始数据分布的统计图形。它由“茎”和“叶”两部分组成 ,通常以数据的高位数值作为树茎,低位数值作为树叶。
3、游程:游程是样本序列中连续出现的变量值的次数。
4、估计标准误差:是度量拟合效果的统计量,它是根据残差平方和除以相应的自由度(n-p-1)后再开方计算出来的,其作用与标准差类似,反映各观察点在直线周围的分散状况。
四、判断
对对对错错
五、计算
1. 答:
⑴因为判定系数
所以 相关系数0.99,可见,广告费与销售量之间呈高度正相关的关系。
⑵从参数估计表中可以看出,销售量对广告费的回归方程为。
提出假设H0:销售量与广告费之间线性关系不显著。根据方差分析表中的Significance-F=2.17E-09<α=0.05,应拒绝假设H0,即认为销售额与广告费之间有显著的线性关系。
提出假设H0:样本来自于没有线性关系的总体。从参数估计表中,有P值=2.17E-09<α=0.05,应拒绝假设H0,即认为样本来自于具有线性关系的总体。
2. 答:
由位置的计算公式得
下四分点的位置为(14+1)*0.25=3.75,该位置的左边有3个数据占总数的25%。
上四分点的位置为(14+1)*0.75=11.25,该位置的左边有11个数据占总数的75%
中位数的位置为(14+1)*0.5=7.5,该位置的左边有7个数据占总数的50%