最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 正文

MINITAB统计基础

来源:动视网 责编:小OO 时间:2025-09-30 00:52:39
文档

MINITAB统计基础

MINITAB统计基础1.正态总体的抽样分布1)样本均值的分布——标准正态分布及T分布样本标准差计算公式:◆T分布的定义:Studenttdistribution,如果X服从标准正态分布,S2服从个自由度的卡方分布,且它们相互,那么随机量所服从的分布称为个自由度的t分布。其分布密度函数为:当时的极限分布即是标准正态分布,当时就是Cauchy分布。T分布只包含1个参数。数学期望和方差分别为0,(时期望不存在,方差不存在)。我们常常用表示υ个自由度的t分布。MINITAB对于更一般的t分布还增
推荐度:
导读MINITAB统计基础1.正态总体的抽样分布1)样本均值的分布——标准正态分布及T分布样本标准差计算公式:◆T分布的定义:Studenttdistribution,如果X服从标准正态分布,S2服从个自由度的卡方分布,且它们相互,那么随机量所服从的分布称为个自由度的t分布。其分布密度函数为:当时的极限分布即是标准正态分布,当时就是Cauchy分布。T分布只包含1个参数。数学期望和方差分别为0,(时期望不存在,方差不存在)。我们常常用表示υ个自由度的t分布。MINITAB对于更一般的t分布还增
MINITAB统计基础

1.正态总体的抽样分布

1)样本均值  的分布——标准正态分布及T分布

样本标准差计算公式:

◆T分布的定义:Student  t  distribution,如果X服从标准正态分布,S2服从个自由度的卡方分布,且它们相互,那么随机量

所服从的分布称为 个自由度的t分布。其分布密度函数为:

当 时的极限分布即是标准正态分布,

当 时就是Cauchy分布。

T分布只包含1个参数。数学期望和方差分别为0,(时期望不存在,方差不存在)。我们常常用表示 υ 个自由度的t分布。MINITAB对于更一般的t分布还增加了一个“非中心参数”,当非中心参数为0时,就得到了我们现在所说的t分布。在用MINITAB计算时,只要注意这一点就行了。

自由度:可以简单理解为在研究问题中,可以自由取值的数据或变量的个数。

范例:

✧Z~N(0,1),求Z=1.98时的概率密度。

计算----->概率分布----->正态分布----->概率密度----->输入常数1.98----->确定

概率密度函数 

正态分布,均值 = 0 和标准差 = 1

   x     f( x )

1.980.0561831

✧。

计算----->概率分布----->正态分布----->累积概率----->输入常数2.4----->确定

累积分布函数 

正态分布,均值 = 0 和标准差 = 1

x P( X <= x )

2.4     0.991802

✧Z~N(0,1),求使得P(Z计算----->概率分布----->正态分布----->逆累积概率----->输入常数0.95----->确定

逆累积分布函数 

正态分布,均值 = 0 和标准差 = 1

P( X <= x ) x

       0.95  1.485

✧自由度=12,求使得。

计算----->概率分布----->t分布----->逆累积概率----->输入自由度12----->输入常数0.95----->确定

逆累积分布函数 

学生 t 分布,12 自由度

P( X <= x ) x

       0.95  1.7822

✧自由度=12,求使得。

计算----->概率分布----->t分布----->累积概率----->输入自由度12----->输入常数3----->确定

累积分布函数 

学生 t 分布,12 自由度

x P( X <= x )

3     0.994467

2)双样本均值差的分布

3)正态样本正态样本方差S2的分布——卡房卡方分布

若X1,X2,……,Xn是从正态总体中抽出的一组样本量为n的随机样本,记

已知时:

当未知时,用  替 后可以得到

其概率密度函数在正半轴上呈正偏态分布。

◆卡方分布的定义:把n个相互的标准正态随机变量的平方和称为自由度为n的卡方分布。它的密度表达式为:

参数 称为自由度。

卡方分布有向右的偏斜,特别在较小自由度情况下( 越小,分布越偏斜)。我们常用  表达自由度为 的卡方分布。

卡方分布有很多用途,其中一项就是用来分析单个正态总体样本方差的状况;还可以用来进行分布的拟合优度检验,即检验资料是否符合某种特定分布;对于离散数据构成的列联表,也可以用来分析两个离散型因子间是否等。

◆卡方分布的性质

a)卡方分布的加法性:设X和Y彼此,且都服从卡方分布,其自由度分别为n1,n2。若令Z=X+Y,则Z服从自由度为n1+n2的卡方分布。

b)若 X ,则,。

计算下列各卡方分布的相关数值:

✧自由度=10,求使得 成立的 x 值。

计算 -----> 概率分布 -----> 卡方分布 -----> 逆累积概率 -----> 自由度=10 -----> 常数=0.95 -----> 确定

逆累积分布函数 

卡方分布,10 自由度

P( X <= x ) x

       0.95  18.307

✧自由度=10,求 。

计算 -----> 概率分布 -----> 卡方分布 -----> 累积概率 -----> 自由度=10 -----> 常数=28 -----> 确定

累积分布函数 

卡方分布,10 自由度

x P( X <= x )

28     0.998195

4)两个的正态样本方差之比的分布——F分布

两个的正态样本方差之比的分布是F分布。

设有两个的正态总体  () 和  () ,它们的方差相等。又设X1,X2,…,Xn是来自 ()的一个样本Y1,Y2,…,Yn是来自 () 的一个样本,这两样相互。它们的样本方差之比是自由度为n-1和m-1的F分布:

n-1称为分子自由度;m-1为分母自由度;F分布的概率密度函数在正半轴上呈正偏态分布。

实际上,F统计量就是由两个卡方随机变量相除所构成的,如果, ,且二者相互,则称二者比值的分布为F分布,即

其密度函数是:

F分布的应用非常广泛,尤其是在判断两正态总体方差是否相等以及方差分析(ANOVA)等问题上面。

✧计算F0.95(8,,18)的数值。

计算 -----> 概率分布 -----> F分布 -----> 逆累积概率 -----> 分子自由度=8 -----> 分母自由度=18 ----->常数=0.95 ----->确定

逆累积分布函数 

F 分布,8 分子自由度和 18 分母自由度

P( X <= x ) x

       0.95  2.51016

2.参数的点估计

1)点估计的概念

用单个数值对于总体参数给出估计的方法称为点估计。

设Ɵ是总体的一个未知参数,X1,X2,…,Xn是从总体中抽取的样本量为n的一个随机样本,那么用来估计未知参数Ɵ的统计量(X1,X2,…Xn)称为Ɵ的估计量,或称为Ɵ的点估计。

我们总是在参数上方画一个帽子“∧”表示该参数的估计量。在工程中经常出现的点估计问题之最好结果是:

对于总体均值 ,   ;

对于总体方差  ,   ;

对于比率p ,   ,X是样本量为n的随机样本中我们感兴趣的那类出现的次数;

对于  1 -  2 , =(两个随机样本均值之差);

对于p1 - p2,估计为 (两个随机样本比率之差);

2)点估计的评选标准

3.参数的区间估计

设Ɵ是总体的一个待估参数,从总体中获得样本量为n 的样本是X1,X2,…,Xn,对给定的显著性水平α(0﹤α﹤1),有统计量:ƟL= ƟL(X1,X2,…,Xn)与ƟU= ƟU(X1,X2,…,Xn),若对于任意Ɵ有P(ƟL≤Ɵ≤ƟU)= 1 - α,则称随机区间[ƟL,ƟU]是Ɵ的置信水平为1-α的置信区间,ƟL与ƟU分别称为置信下限和置信上限。

置信区间的大小表达了区间估计的精确性,置信水平表达了区间估计的可靠性, 1 - α是区间估计的可靠程度,而 α 表达了区间估计的不可靠程度。

在进行区间估计时,必须同时考虑置信水平与置信区间两个方面。对于置信区间的选取,一定要注意,决不能认为置信水平越大的置信区间就越好。实际上,置信水平定的越大,则置信区间相应也一定越宽,当置信水平太大时,则置信区间会宽得没有实际意义了。这两者要结合在一起考虑,才更为实际。通常我们取置信水平为0.95,极个别情况下可取0.99或0.90,一般不取其他的置信水平。

1)单正态总体均值的置信区间

当时,正态总体均值的置信区间有以下三种情况:

a)当总体方差已知时,正态总体均值 的 1 – α置信区间为:

式中,是标准正态分布的  分位数,也就是双侧 α 分位数。例如α=0.05时,。

在MINITAB中,我们通过:统计 -----> 基本统计量 -----> 单样本Z 来实现的。

由于实际情况中,已知标准差的情况很少见,因此我们这里重点关注的是标准差位置时的情况。

b)当总体方差未知时, 用样本标准差S代替,此时正态总体均值 的 1 – α置信区间为:

式中, 表示自由度为n – 1的 t 分布的  分位数,也就是t分布的双侧 α 分位数。例如α=0.05时,样本量n = 16时,,其值略大于。

在MINITAB中,我们通过:统计 -----> 基本统计量 -----> 单样本t 来实现的。

✧某集团公司正推进节省运输费用活动,下表为20个月使用的运输费用调查结果数据:

1742

1827

1681

1742

1676

1680

1792

1735

1687

1852

1861

1778

1747

1678

1754

1799

1697

16

1804

1707

假设运输费用是服从正态分布的,求运输费用均值的95%置信区间。

统计 -----> 基本统计量 -----> 单样本t -----> 样本所在列 = 运输费用 -----> 选项  -----> 置信水平 = 95  -----> 确定。

单样本 T: 运输费用 

                              均值标

变量       N    均值  标准差    准误    95% 置信区间

运输费用  20  1745.2    61.9    13.8  (1716.2, 1774.2)

c)前两种情况讨论的是当总体为正态分布时, 的区间估计,然而当总体不是正态分布时,如果样本量n 超过30,则可根据中心极限定理知道: 仍近似服从正态分布,因而仍可用正态分布总提示的均值 的区间估计方法,而且可以直接用样本标准差代替总体标准差,即采用公式:

在MINITAB中,通常直接采用:统计 -----> 基本统计量 -----> 图形化汇总 中得到总体均值的置信区间结果。只不过要注意的是:总体非正态时,在小样本情况下此结果并不可信,只有当样本量超过30后,由于中心极限定理的保证,此结果才是可信的。

2)单正态总体方差和标准差的置信区间

当时,正态总体方差的置信区间是:

式中,和分别是  分位数与  分位数。

当时,正态总体标准差的置信区间是:

✧某集团公司正推进节省运输费用活动,下表为20个月使用的运输费用调查结果数据:

1742182716811742167616801792173516871852
18611778174716781754179916971618041707
假设运输费用是服从正态分布的,求运输费用方差和标准差的95%置信区间。

统计 -----> 基本统计量 -----> 单方差 -----> 样本所在列 = 运输费用 -----> 选项  -----> 置信水平 = 95  -----> 确定。

单方差检验和置信区间: 运输费用 

方法

卡方方法仅适用于正态分布。

Bonett 方法适用于任何连续分布。

统计量

变量       N  标准差  方差

运输费用  20    61.9  3830

95% 置信区间

                   标准差置信    方差置信区

变量      方法        区间           间

运输费用  卡方    (47.1, 90.4)  (2215, 8170)

          Bonett  (49.0, 86.6)  (2401, 7507)

求总体标准差置信区间另一种方法:统计----->基本统计量----->图形化汇总----->变量:运输费用----->置信水平:95 ----->确定

3)单总体比率的置信区间

当时,也就是X取“非0则1”的0-1分布,我们常需要估计总体中感觉的那类比率的置信区间,比如,一批产品中,不合格品率的大致范围;顾客满意度调查中,有抱怨顾客的比率范围等。

这里我们记总体比率为p,样本比率为  。可以证明,当样本量足够大时(要求np>5及np(1-p)>5),且p值适中(0.1✧一电视台为了调查新节目收视率,在节目放映时间内进行了电话调查。在接受调查的2000名被调查者中有1230名正在收看本节目。求此节目收视率的95%置信区间。

统计----->基本统计量----->单比率----->汇总数据:事件数=1230,实验数=2000----->选项----->置信水平:95 ;勾选使用正态分布的检验和区间----->确定

由于np>5及np(1-p)>5,可用于正态分布近似二项分布,故可以勾选使用基于正态分布的检验和区间。

单比率检验和置信区间 

样本     X     N    样本 p      95% 置信区间

1     1230  2000  0.615000  (0.593674, 0.636326)

使用正态近似。

4)双总体均值差的置信区间

设有两个总体,,从总体X中抽取的样本X1,X2,…,Xn,样本均值为  ,样本方差为  ,样本标准差为  ,从总体Y中抽取的样本Y1,Y2,…,Yn,样本均值为  ,样本方差为  ,样本标准差为  。

对两总体均值差异的区间估计常有以下三种情况:

a)两个总体均服从正态分布,且两个总体的方差  都已知时,两总体均值差异  的1-α 置信水平下的置信区间为:

只要样本量足够大,无论两总体的方差是否相等,上式都成立。

b)两个总体均服从正态分布,且两个总体的方差  均未知时,两总体均值差异  的1-α 置信水平下的置信区间为:

式中,

✧一家冶金公司需要减少其排放到废水中的生物氧需求量含量。用于废水处理的活化泥供应商建议,用纯氧取代空气吹入活化泥以改善生物氧需求量含量(此数值越小越好)。从两种处理的废水中分别抽取10个和9个样品,数据如下:

空气184194158218186218165172191179
氧气163185178183171140155179175
已知生物氧需求量含量服从正态分布,试确定:该公司采用空气和采用纯氧减少生物氧需求量含量均值之差的95%置信区间。

求两总体的置信区间:统计----->基本统计量----->双样本t----->样本在不同列中:第一=空气,第二=氧气----->勾选假定等方差----->选项:置信水平=95,备择=不等于----->确定。

双样本 T 检验和置信区间: 空气, 氧气 

空气 与 氧气 的双样本 T

                         均值标

       N   均值  标准差    准误

空气  10  186.5    20.0     6.3

氧气   9  169.9    14.7     4.9

差值 = mu (空气) - mu (氧气)

差值估计值:  16.61

差值的 95% 置信区间:  (-0.58, 33.80)

差值 = 0 (与 ≠) 的 T 检验: T 值 = 2.04 P 值 = 0.057 自由度 = 17

两者都使用合并标准差 = 17.7356

c)当两个总体均服从正态分布,且两个总体的方差  均未知时,两总体均值差异  的1-α 置信水平下的置信区间为:

式中,自由度υ的计算公式为:

✧假定A,B两名工人生产相同规格的轴棒,关键尺寸是轴棒的直径。由于A使用的是老式车床,B使用的是新式车床,二者精度可能有差异。经检验,他们的直径数据确实来自两个方差不等的正态分布。现他们各测定13根轴棒直径,数据如下:

12345678910111213
A14.7614.2114.0215.0810.6512.1816.6718.2012.2411.2116.6713.4516.85
B12.3710.2813.1813.2613.8010.9610.5712.8311.6713.5412.4213.2412.52
试确定A,B生产的轴棒直径差异的95%置信区间。

求两总体的置信区间:统计----->基本统计量----->双样本t----->样本在不同列中:第一=空气,第二=氧气----->选项:置信水平=95,备择=不等于----->确定。

双样本 T 检验和置信区间: A工人, B工人 

A工人 与 B工人 的双样本 T

                          均值标

        N   均值  标准差    准误

A工人  13  14.32    2.35    0.65

B工人  13  12.36    1.15    0.32

差值 = mu (A工人) - mu (B工人)

差值估计值:  1.965

差值的 95% 置信区间:  (0.435, 3.496)

差值 = 0 (与 ≠) 的 T 检验: T 值 = 2.71 P 值 = 0.015 自由度 = 17

✧随机样本取自均值未知,标准差未知的两个正态分布总体,若第一个总体样本标准差S1=0.73,样本量n=25,,第二个总体样本标准差S2=0.,样本量n=20,。求的95%置信区间。

统计----->基本统计量----->双样本t----->汇总数据:第一(样本数量=25,均差=6.9,标准差=0.73),第二(样本数量=20,均差=6.7,标准差=0.)----->选项:置信水平=95 ----->确定。

双样本 T 检验和置信区间 

                         均值标

样本   N   均值  标准差    准误

1     25  6.900   0.730    0.15

2     20  6.700   0.0    0.20

差值 = mu (1) - mu (2)

差值估计值:  0.200

差值的 95% 置信区间:  (-0.301, 0.701)

差值 = 0 (与 ≠) 的 T 检验: T 值 = 0.81 P 值 = 0.423 自由度 = 36

5)双总体比率差的置信区间

设两个总体的比率分别为p1和p2,为了估计p1 - p2 ,分别从两个总体中各随机抽取样本量为n1和n2的两个随机样本,并计算两个样本的比率,可以证明p1 - p2的置信水平为1 –α的置信区间为:

✧为了解员工对工资的满意度,对250名男员工、200名女员工进行调查,数据如下:

区分样本数满意
250110
200104
合计450214
求男女员工对工资满意度差异的95%置信区间。

统计----->基本统计量----->双比率----->汇总数据:第一(事件=110,实验=250),第二(事件=104,实验=200)----->选项:置信水平=95 ----->勾选使用P的合并估计值进行检验 ----->确定。

双比率检验和置信区间 

样本    X    N    样本 p

1     110  250  0.440000

2     104  200  0.520000

差值 = p (1) - p (2)

差值估计值:  -0.08

差值的 95% 置信区间:  (-0.172630, 0.0126298)

差值 = 0(与 ≠ 0) 的检验: Z = -1.69  P 值 = 0.091

Fisher 精确检验: P 值 = 0.106

文档

MINITAB统计基础

MINITAB统计基础1.正态总体的抽样分布1)样本均值的分布——标准正态分布及T分布样本标准差计算公式:◆T分布的定义:Studenttdistribution,如果X服从标准正态分布,S2服从个自由度的卡方分布,且它们相互,那么随机量所服从的分布称为个自由度的t分布。其分布密度函数为:当时的极限分布即是标准正态分布,当时就是Cauchy分布。T分布只包含1个参数。数学期望和方差分别为0,(时期望不存在,方差不存在)。我们常常用表示υ个自由度的t分布。MINITAB对于更一般的t分布还增
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top