
请在以下五组题目中任选一组作答,满分100分。
第一组:
一、计算题(每小题25分,共50分)
1、下表中的数据是主修信息系统专业并获得企业管理学士学位的学生,毕业后的月薪(用y表示)和他在校学习时的总评分(用x表示)的回归方程。
| 总评分 | 月薪/美元 | 总评分 | 月薪/美元 |
| 2800 | 3000 | ||
| 3100 | 3400 | ||
| 3500 | 3100 |
| 2800 | 7280 | 7840000 | ||
| 3100 | 10540 | 9610000 | ||
| 3500 | 12600 | |||
| 3000 | 9600 | 9000000 | ||
| 3400 | 11900 | |||
| 3100 | 90 | 9610000 | ||
| = | =100 | = | =60910 |
==
=100/*6=
于是
2、设总体X的概率密度函数为
其中为未知参数,是来自X的样本。
(1)试求的极大似然估计量;
(2)试验证 是的无偏估计量。
解:
(1)当>0时,似然函数为:
令 ,即
解得:
是的单调函数,所以
的极大似然估计量
(2)因为
,
故是的无偏估计量。
二、简答题(每小题25分,共50分)
1.在统计假设检验中,如果轻易拒绝了原假设会造成严重后果时,应取显着性水平较大还是较小,为什么?
答:取显着性水平较小,因为如果轻易拒绝了原假设会造成严重后果,那就说明在统计假设检验中,拒绝原假设的概率要小,而假设检验中拒绝原假设的概率正是事先选定的显着性水平α。
2.加权算术平均数受哪几个因素的影响?若报告期与基期相比各组平均数没变,则总平均数的变动情况可能会怎样?请说明原因。
答:加权算术平均数受各组平均数和次数结构(权数)两因素的影响。若报告期与基期相比各组平均数没变,则?总平均数的变动受次数结构(权数)变动的影响,可能不变、上升、下降。如果各组次数结构不变,则总平均数不变;如果组平均数高的组次数比例上升,组平均数低的组次数比例下降,则总平均数上升;如果组平均数低的组次数比例上升,组平均数高的组次数比例下降,则总平均数下降。
第二组:
一、计算题(每小题25分,共50分)
1、某一汽车装配操作线完成时间的计划均值为分钟。由于完成时间既受上一道装配操作线的影响,又影响到下一道装配操作线的生产,所以保持分钟的标准是很重要的。一个随机样本由45项组成,其完成时间的样本均值为分钟,样本标准差为分钟。在的显着性水平下检验操作线是否达到了分钟的标准。
答案:
根据题意,此题为双侧假设检验问题
(1)原假设:;备择假设:
(2)构造统计量:,得
(3)由于,则查表得:
(4),,所以拒绝原假设,即在的显着水平下没有达到分钟的标准。
2、某商店为解决居民对某种商品的需要,调查了100户住户,得出每月每户平均需要量为10千克,样本方差为9。若这个商店供应10000户,求最少需要准备多少这种商品,才能以95%的概率满足需要?
解: 设每月每户至少准备
✍
查表得, ✍
若供应10000户,则需要准备104400kg。
二、简答题(每小题25分,共50分)
1.解释相关关系的含义,说明相关关系的特点。
答:
变量之间存在的不确定的数量关系为相关关系。
相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个;变量之间的相关关系不能用函数关系进行描述,但也不是无任何规律可循。通常对大量数据的观察与研究,可以发现变量之间存在一定的客观规律。
2.为什么对总体均值进行估计时,样本容量越大,估计越精确?
答:因为总体是所要认识的研究对象的全体,它是具有某种共同性质或特征的许多单位的集合体.总体的单位数通常用N来表示,N总是很大的数.样本是总体的一部分,它是从总体中随机抽取出来、代表总体的那部分单位的集合体.样本的单位数称为样本容量,通常用n表示。样本容量n越大,就越接近总体单位数N,样本均值就越接近总体均值,对总体均值进行估计时,估计越精确。
第三组:
一、计算题(每小题25分,共50分)
1、根据下表中Y与X两个变量的样本数据,建立Y与X的一元线性回归方程。
| Y X | 5 | 10 | 15 | 20 | |
| 120 | 0 | 0 | 8 | 10 | 18 |
| 140 | 3 | 4 | 3 | 0 | 10 |
| fx | 3 | 4 | 11 | 10 | 28 |
设x为自变量,y为因变量,一元线性回归
设回归方程为y=
==
回归方程为y=
2、
| 每包重量(克) | 包数(包)f | x | xf | x- | (x-)2f |
| 148—149 | 10 | 1485 | |||
| 149—150 | 20 | 2990 | |||
| 150—151 | 50 | 7525 | |||
| 151—152 | 20 | 3030 | |||
| 合计 | 100 | -- | 15030 | -- |
(2)以99%的概率估计该批茶叶平均每包重量的置信区间((99)≈);
(3)在ɑ=的显着性水平上检验该制造商的说法是否可信((99)≈)(4)以95%的概率对这批包装茶叶达到包重150克的比例作出区间估计(=);
(写出公式、计算过程,标准差及置信上、下保留3位小数)
二、简答题(每小题25分,共50分)
1.区间估计与点估计的结果有何不同?
答:点估计是使用估计量的单一值作为总体参数的估计值;区间估计是指定估计量的一个取值范围都为总体参数的估计。
2.统计调查的方法有那几种?
答:三种主要调查方式:普查,抽样调查,统计报表。实际中有时也用到重点调查和典型调查。
第四组:
一、计算题(每小题25分,共50分)
1、假定某化工原料在处理前和处理后取样得到的含脂率如下表:
| 处理前 | ||||||
| 处理后 |
解:
根据题中数据 可得:
,
由于 <30,且 总体方差未知,所以先用F检验两总体方差是否存在差异。
(1)设:;
则 F=
由,查F分布得,
接受,即处理前后两总体方差相同。
(2)设,
则T=,
T=<=
接受,即处理前后含脂率无显着差异。
2、一种新型减肥方法自称其参加者在第一个星期平均能减去至少8磅体重.由40名使用了该种方法的个人组成一个随机样本,其减去的体重的样本均值为7磅,样本标准差为3.2磅.你对该减肥方法的结论是什么?(α=,μα/2=, μα=
二、简答题(每小题25分,共50分)
1.解释抽样推断的含义。
答: 简单说,就是用样本中的信息来推断总体的信息。总体的信息通常无法获得或者没有必要获得,这时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量特征。
2.时期数列与时点数列有哪些不同的特点?
答:时期数列具有以下特点: (1)数列具有连续统计的特点; (2)数列中各个指标数值可以相加; (3)数列中各个指标值大小与所包括的时期长短有直接关系。 时点数列具有以下特点: (1)数列指标不具有连续统计的特点; (2)数列中各个指标值不具有可加性; (3)数列中每个指标值的大小与其时间间隔长短没有直接联系。
第五组:
一、计算题(每小题25分,共50分)
1、某商业企业商品销售额1月、2月、3月分别为216,156,万元,月初职工人数1月、2月、3月、4月分别为80,80,76,88人,试计算该企业1月、2月、3月各月平均每人商品销售额和第一季度平均每月人均销售额。(写出计算过程,结果精确到万元\\人)
解:
依题意,计算如下:
(人)
2、下表中的数据是主修信息系统专业并获得企业管理学士学位的学生,毕业后的月薪(用y表示)和他在校学习时的总评分(用x表示)的回归方程。
| 总评分 | 月薪/美元 | 总评分 | 月薪/美元 |
| 2800 | 3000 | ||
| 3100 | 3400 | ||
| 3500 | 3100 |
| 2800 | 7280 | 7840000 | ||
| 3100 | 10540 | 9610000 | ||
| 3500 | 12600 | |||
| 3000 | 9600 | 9000000 | ||
| 3400 | 11900 | |||
| 3100 | 90 | 9610000 | ||
| = | =100 | = | =60910 |
==
=100/*6=
于是
二、简答题(每小题25分,共50分)
1.为什么要计算离散系数?
答: 离散系数是指一组数据的标准差与其相应得均值之比,也称为变异系数。 对于平均水平不同或计量单位不同的不同组别的变量值,是不能用方差和标准差比较离散程度的。为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。离散系数的作用主要是用于比较不同总体或样本数据的离散程度。离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。
2.简述算术平均数、几何平均数、调和平均数的适用范围。
答:几何平均数主要适用于比率的平均。一般地说,如果待平均的变量x与另外两个变量f和m 有fx=m 的关系时,若取f为权数,应当采用算术平均方法;若取m 为权数,应当采用调和平均方法。
要求:
1. 完成,作答时要写明题型、题号;
2.作答方式:手写作答或电脑录入,使用A4格式白纸;
3.提交方式:以下两种方式任选其一,
1)手写作答的同学可以将作业以图片形式打包压缩上传;
2)提交电子文档的同学可以将作业以word文档格式上传;
4. 上传文件命名为“中心-学号-姓名-科目.rar” 或“中心-学号-姓名-科目.doc”;
5.文件容量大小:不得超过20MB。
