5.1什么是统计假设?统计假设有几种?各有何含义?假设测验时直接测验的统计假设是哪一种?为什么?
统计假设:就是指试验工作者提出有关某一总体参数的假设,称为统计假设。
统计假设有两种:无效假设和备择假设。
无效假设(H0):无效假设是对总体提出的一个假想目标。“无效”的意义是处理效应与总体参数之间没有真实的差异,试验结果中差异乃误差所致。
备择假设(HA): 认为试验结果中的差异是由于总体参数不同所引起的,它与无效假设是相反的。
假设测验时直接测验的统计假设是哪一种?为什么?
直接测验的是无效假设。因为无效假设是有意义的,据之可以算出因抽样误差而获得样本结果得概率。
5.2什么叫统计推断?它包括哪些内容?
统计推断:就是根据抽样分布规律和概率理论,由样本结果(统计数)来推断总体特征(参数)。
统计推断包括:统计假设测验和参数估计。
5.3什么叫第一类错误?什么叫第二类错误?在不增加犯第一类错误的概率的情况下,如何降低犯第二类错误的概率?
第一类错误:否定真实假设的错误称为第一类错误。
第二类错误:指一个接受不真实假设的错误称为第二类错误。
补充:
两种错误的区别及联系:
区别:第一类错误只有在否定无效假设时才会发生;
第二类错误只有接受无效假设时才会发生。
联系:在样本容量相同的情况下,第一类错误减少,第二类错误就会增加;反之第二类错误减少,第一类错误就会增加。
如显著水平从0.05提高到0.01,就更容易接受无效假设,因此犯第一类错误的概率下降,但犯第二类错误概率则增加。
在不增加犯第一类错误的概率的情况下,如何降低犯第二类错误的概率:
答:在显著水平已固定时,则改进试验技术和增加样本容量可以有效地降低犯第二类错误的概率。为什么?
α=0.05时接受无效假设的区域为
( ) 想减少有两种方法:
①增加样本容量n;
②改进试验技术而减少标准差。
5.4已知某品种的棉花纤维长度服从正态分布N(29.8,2.25)。(1)若n=10,要在α=0.05水平上否定,求其否定区域。(2)现以n=20抽样测得,试问其长度是否显著优于的总体?
解(1):已知α=0.05时,标准正态离差u的否定区为
和
由来代替u,则
同样
∴否定区域为()。
解(2):提出假设
(一尾测验)
α=0.05
测验计算:
推断:所得,因此接受。即以n=20抽样测得的样本来自于N(29.8,2.25)的总体。
5.5已知10株杂交水稻的单株产量为(g)为:272、200、268、247、267、246、363、216、206、256。(1)试测验。(2)估计单株产量总体平均数在95%置信度下的置信区间。
解(1):提出假设
(两尾测验)
α=0.05
测验计算:
由于n=10是小样本,因此用t测验:
推断:实得t=0.2796<,故接受无效假设,即该样本抽自总体平均数250g得总体中,与的差异是由抽样误差造成的。
(2)设在95%置信度下的置信区间为[L1, L2]
杂交水稻单株产量总体平均数在95%置信度下的置信区间为[220.939g, 287.26g] 。
5.6从一个方差为24的正态总体中抽取一个容量为6的样本,求得其平均数为15,又从一个方差为80的正态总体中抽取一个容量为8的样本,并知其平均数为13,试测验两个样本的差异显著性。
解:假设H0:μ1=μ2,对HA:μ1≠μ2,
显著水平 α=0.05
测验计算:
由于两个总体方差已知,因此用u测验:
=(15-13)/3.742=0.5345
推断:实得u=0.5345<u0.05=1.96,接受H0:μ1=μ2,即两个样本的总体平均数间没有显著差异。
5.7一个小麦新品种经过4代培育,从第5代中抽出10株,株高(cm)为:66、65、66、68、62、65、63、66、68、62,又从第6代中抽出10株,株高(cm)为:、61、57、65、65、63、62、63、、60。问:(1)株高性状是否已达到稳定?(2)估计两个世代的小麦株高总体平均数的差数的95%置信度下的置信限。
解:假设H0:μ1=μ2,对HA:μ1≠μ2,
显著水平 α=0.05
测验计算:n1=10
n2=10
由于两个样本的方差未知,且小样本,因此用t测验:
推断:实得t=2.57>t0.05,18=2.101,否定H0:μ1=μ2,接受备择假设,即株高性状没达到稳定。
(2)设在95%置信度下的置信区间为[L1, L2]
两个世代的小麦株高总体平均数的差数的95%置信度下的置信区间为[0.486cm, 4.914cm] 。
5.8 选面积为30m2的玉米小区10个,各分成两半,一半去雄另一半不去雄,得产量(kg)为:
去雄:28、30、31、35、30、34、30、28、34、32
未去雄:25、28、29、29、31、25、28、27、32、27
(1)用成对比较法测验的假设;
(2)求包括在内置信度为95%的区间;
(3)试按成组平均数比较法测验的假设;
(4)求包括在内置信度为95%的区间;
(5)比较上述(1)和(3)项测验结果并加以解释。
解:(1) 假设:
显著水平 α=0.05
测验计算:
推断:实得t=3.444>,故否定无效假设,即该样本去雄与未去雄之间,有显著差异。
(2)设在95%置信度下的置信区间为[L1, L2]
∴杂交水稻单株产量总体平均数在95%置信度下的置信区间为[1.0kg, 5.136kg] 。(3)试按成组平均数比较法测验的假设;
假设H0:μ1=μ2,对HA:μ1≠μ2,
显著水平 α=0.05
测验计算:
由于两个样本的方差未知,且小样本,因此用t测验:
推断:实得t=2.905>t0.05,18=2.101,否定H0:μ1=μ2,接受备择假设,即该样本去雄与未去雄之间,有显著差异。
(4)设在95%置信度下的置信区间为[L1, L2]
∴杂交水稻单株产量去雄与未去雄的总体平均数差数在95%置信度下的置信区间为[0.858kg, 5.342kg] 。
(5)比较上述(1)和(3)项测验结果并加以解释。
通过两种方法所得的显著性测验的结果是相同,但两个平均数差数在置信度95%下的置信区间不同,成组法计算的置信区间更窄。
说明,成组数据按成组法比较,易犯第一类错误;
而成组数据按成组法比较,易犯第二类错误。