一、设是来自总体的样本。记,试确定下列统计量的分布:
(1);(2);(3);(4)。
解:(1)由抽样分布定理,
(2)因,故
(3)由抽样分布定理,
(4)因,与,故。
二、在某个电视节目的收视率调查中,随机调查了1000人,有633人收看了该节目,试根据调查结果,解答下列问题:
(1)用矩估计法给出该节目收视率的估计量;
(2)求出该节目收视率的最大似然估计量,并求出估计值;
(3)判断该节目收视率的最大似然估计是否是无偏估计;
(4)判断该节目收视率的最大似然估计是否是有效估计。
解:总体为调查任一人时是否收看,记为,其中为收视率
(1)因,而,故收视率的矩估计量为
(2)总体的概率分布为
解得收视率的最大似然估计量为
现有一参量为1000的样本, 且
则,故收视率的极大似然估计值为0.633.
(3)因,故是无偏估计
(4)因,
又
故 收视率的最大似然估计是的有效估计。
三、甲制药厂进行有关麻疹疫苗效果的研究,用表示一个人用这种疫苗注射后的抗体强度,假定X服从正态分布。另一家与之竞争的乙制药厂生产的同种疫苗的平均抗体强度是1.9。现甲厂声称其产品有更高的平均抗体强度,为证实这一点,检测了16个志愿者注射甲厂疫苗后的抗体强度,得样本均值,样本方差为。请回答下列问题:
(1)提出该问题的原假设与备择假设;
(2)写出犯第一类错误的概率表达式,并说明犯第一类错误的实际后果;
(3)根据样本数据,在显著性水平时,检验你的假设,验证甲厂疫苗是否有更高的平均抗体强度;
(4)求甲厂疫苗抗体强度方差的置信度为0.95的置信区间。
解:设未知
(1)
(2)犯第一类错误的概率为:
犯第一类错误误认为甲厂疫苗有更高的平均抗体强度,其实际后果是可能对人的生命健康安全造成威胁。
(3)由于未知,,
的拒绝域为:
又
因,故拒绝,接受。即在时可以认为甲厂疫苗有更高的平均抗体强度。
(4)因未知,
故方差的置信度为0.95的置信区间为。
四、为了研究慢性支气管炎与吸烟量的关系,调查了360人,统计数字如下表所示:
吸烟量
类型 | 10支/日 | 20支/日 | 和 |
患病人数 | 26 | 147 | 173 |
健康者 | 30 | 123 | 153 |
和 | 56 | 270 | 360 |
解:此为性检验
:慢性支气管炎与吸烟量无关,:慢性支气管炎与吸烟量有关
拒绝域:
故接受,认为慢性气管炎与吸烟量无关。
五、为了决定在老鼠中血糖的减少量和注射胰岛素A的剂量间的关系,将同样条件下繁殖的7只老鼠注射不同剂量的胰岛素A,获得以下数据:
A的剂量 | 0.2 | 0.25 | 0.25 | 0.3 | 0.4 | 0.5 | 0.5 |
血糖减少量 | 30 | 26 | 40 | 35 | 54 | 56 | 65 |
(1)试根据以上数据,建立血糖减少量对胰岛素A的剂量的样本回归直线方程;
(2)求出;
(3)写出回归系数显著性检验的原假设与备择假设;
(4)若用检验法,写出回归系数显著性检验的拒绝域;
(5)根据以上数据判断胰岛素A的剂量与血糖减少量之间是否存在线性关系。()
解:(1)
得血糖减少量对胰岛素A的剂量的回归方程为:。
(2)
(3)
(4)
(5)
因,故拒绝,认为存在线性关系。
六、现有某种型号的电池3批,它们分别是A,B,C这3个工厂生产的,为评比其质量,各随机抽取5只电池为样本,经试验测得其寿命如下表所示:
工厂 | 寿命 |
A | 40 48 38 42 45 |
B | 26 34 30 28 32 |
C | 39 40 43 50 50 |
(1)该问题的指标是什么?因素是什么?因素的水平是什么?
(2)数据应该满足的基本假定有哪些?
(3)提出该问题的原假设与备择假设。
解:(1)指标是寿命,因素是工厂,因素的水平是A,B,C三个不同的工厂
(2)同一工厂的电池寿命数据是来自同一个正态总体的样本
不同工厂的电池寿命数据是来自相互的正态总体,各总体方差相同
(3):不同水平下的平均电池寿命相同
:至少有两个水平下的平均电池寿命不同
七、请简述为什么正交试验设计可以用较少的试验次数找到较优的水平搭配。
答:正交表保证所做的试验的水平搭配均衡地分散在所有各种水平搭配之中,因而代表性强,容易从中找到较优的水平搭配。这是正交表的均衡分散性。另外,对于每个因子,在它各个水平下的中,其他因子的各个水平出现的次数都相同。这保证了中最大限度地排除了其他因子的干扰,因而有可能通过比较好的值来找出较优的水平。这是正交表的整齐可比性。