类别:网教 专业: 市场管理,工商企业管理 2016年12月
课程名称【编号】: 统计学原理 【9062】 A卷
大作业 满分:100 分
简答与计算(要求:前三题至少100字,后三题列出完整步骤;一~三题至少选择一题;四~六题至少选择一题。每题50分)
一、一个完整的统计调查方案应包括哪些主要内容?
参:(1) 确定调查目的。 (2) 确定调查对象和调查单位。 (3) 确定调查项目, 拟定调查表。 (4) 确定调查时间和时限。 (5) 确定调查的组织和实施计划。(此答案未达100字,建议不选)
二、简述相关分析和回归分析的关系?
参:相关分析不必区分自变量(解释变量)和因变量(被解释变量),变量之间是平行关系,而回归分析要根据研究目的确定自变量和因变量,变量之间是因果关系;相关分析中两个变量都是随机的,而回归分析中,因变量是随机变量,而自变量是非随机的;回归分析可以得到变量之间关系的方向、强弱程度和具体数量变动关系,而相关分析只能确定变量之间关系的方向和程度。回归分析是在相关分析的基础之上,进一步研究现象之间的数量变化规律。
三、 统计数据收集过程中,可能有哪些误差?
参:统计数据收集过程中,可能存在两种误差:观测性误差和代表性误差。
观测性误差(登记性误差或调查性误差),是在调查观测的各个环节因工作粗心,或被观测者不愿很好配合而造成的所收集数据与实际情况不符的误差。观测性误差在全面调查和非全面调查中都会产生。
代表性误差是在抽样调查中,由于样本不能完全代表总体而产生的估计结果与总体真实数量特征不符的误差。代表性误差又分为系统性代表性误差 和偶然性代表性误差,系统性代表性误差是指由于抽样框不完善,抽样违反随机原则,被调查者无回答等因素引起的误差;系统性代表性误差通常难以计算和控制。偶然性代表性误差是由于抽样的随机性引起的样本结构与总体结构不完全相符,从而产生的估计结果与总体真值不一致的误差;偶然性代表性误差不可避免,但是可以计算和控制。抽样调查中的观测性误差和系统性代表性误差统称为非抽样误差,而偶然性代表性误差称为抽样误差。
四、某市调查400户居民家庭收入资料如下表:
人均月收入(元) | 组中值 | 家庭户数 | 月收入 |
100—200 200—300 300—400 400—500 500—600 | 150 250 350 450 550 | 40 120 140 80 20 | 6000 30000 49000 36000 11000 |
合计 | - | 400 | 132000 |
参:
全距 = 600-100=500(元)
平均值 = 132000/400=330(元)
平均差MD =(|150-330|×40+|250-330|×120+|350-330|×140+|450-330|×80+|550-330|×20)÷400=84
标准差σ={【(150-330)平方×40+(250-330)平方×120+(350-330)平方×140+(450-330)平方×80+(550-330)平方×20】÷400}开平方=102.96(元)
标准差系数=102.96/330=0.312
五、对某地区120家企业按利润额进行分组,结果如表所示。
按利润额分组(万元) | 企业数(个) | 向上累计 |
200—300 300—400 400—500 500—600 600以上 | 19 30 42 18 11 | 19 49 91 109 120 |
合计 | 120 |
(2)计算分布的偏态系数和峰度系数。
参:(一)
(1)众数:因为这120家企业中有42家企业的利润都在400-500万元,出现的次数最多。L=400,U=500, f表示众数所在组次数=42, f-1表示众数所在组前一组的次数=30, f+1表示众数所在组后一组的次数=18,代入上限公式,得众数:
=500-[(42-18)/(42-18)+(42-30)] ×(500-400)=433.33万元
(2)中位数的位置=(n+1)/2=60.5,位于400-500万元组
Me——中位数;L——中位数所在组下限=400;U——中位数所在组上限=500;fm——为中位数所在组的次数=42;∑f——总次数=120;d——中位数所在组的组距(U-L);Sm − 1——中位数所在组以下的累计次数=49;Sm + 1——中位数所在组以上的累计次数=29。
代入下限公式,得中位数:
=400+[(120/2-49)/42] ×(500-400)=426.19 万元。
(3)5个利润额组的组中值分别为:
(200+300)/2=250,(300+400)/2=350,(400+500)/2=450,(500+600)/2=550,600+100/2=650
均值=(19×250+30×350+42×450+18×550+11×650)/120=426.67万元
(二)
先计算120家企业利润额的标准差σ={【(250-426.67)平方×19+(350-426.67)平方×30+(450-426.67)平方×42+(550-426.67)平方×18+(650-426.67)平方×11】/120}开平方=116
分布的偏态系数SKp=
峰度系数=
六、某加油站经理希望了解驾车人士在该加油站的加油习惯。在一周内,他随机地抽取100名驾车人士调查,得到如下结果:平均加油量等于13.5加仑,样本标准差是3.2加仑,有19人购买无铅汽油。试问:
(1)以0.05的显著性水平,是否有证据说明平均加油量并非12加仑?
(2)计算(1)的p-值。
(3)以0.05的显著性水平来说,是否有证据说明少于20%的驾车者购买无铅汽油?
(4)计算(3)的p-值。
参:
(1)假设检验为。采用正态分布的检验统计量。查出=0.05水平下的临界值为1.96。计算统计量值。因为z=4.6875>1.96,所以拒绝原假设。
(2)对应p值=2(1-F(z)) ,查表得到F(z)在0.999 994和0.999 999之间,所以p值在0.000 006和0.000 001之间(因为表中给出了双侧检验的接受域概率,因此本题中双侧检验的p值=1-F(|z|),直接查表即得F(|z|))。p值<0.05,拒绝原假设。都说明平均加油量并非12加仑。
(3)假设检验为。采用成数检验统计量。查出=0.05水平下的临界值为1.和1.65之间。计算统计量值,因此z=-2.5<-1.65(<-1.),所以拒绝原假设。
(4)p值为0.00062(因为本题为单侧检验,p值=(1-F(|z|))/2 )。显然p值<0.05,所以拒绝原假设。