最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 正文

非参数统计十道题

来源:动视网 责编:小OO 时间:2025-09-23 21:20:55
文档

非参数统计十道题

非参数统计----十道题09统计学王若曦32009121114一、Wilcoxon符号秩检验下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数,数据已经按升序排列:4.125.817.639.7410.3911.9212.3212.13.5414.45人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,试用上述数据检验这种看法。数据来源:《非参数统计(第二版)》吴喜之手算:建立假设组:编号纯酒精数xD=x-8|D||D|的秩D的符号14.12-3.883.885-25.81-
推荐度:
导读非参数统计----十道题09统计学王若曦32009121114一、Wilcoxon符号秩检验下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数,数据已经按升序排列:4.125.817.639.7410.3911.9212.3212.13.5414.45人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,试用上述数据检验这种看法。数据来源:《非参数统计(第二版)》吴喜之手算:建立假设组:编号纯酒精数xD=x-8|D||D|的秩D的符号14.12-3.883.885-25.81-
非参数统计----十道题

09统计学

王若曦

32009121114

一、Wilcoxon 符号秩检验

下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数,数据已经按升序排列:

4.12  5.81  7.63  9.74  10.39  11.92  12.32  12.  13.54  14.45

人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,试用上述数据检验这种看法。

数据来源:《非参数统计(第二版)》 吴喜之

手算:

建立假设组:

编号纯酒精数xD=x-8|D||D|的秩D的符号
14.12-3.883.885-
25.81-2.192.193-
37.63-0.370.371-
49.741.741.742+
510.392.392.394+
611.923.923.926+
712.324.324.327+
812.4.4.8+
913.545.545.549+
1014.456.456.4510+

查表得P=0.032<=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。

SPSS:

操作:Analyze——Nonparametric Tests——2-Related Sample Test

Ranks
NMean RankSum of Ranks
c - xNegative Ranks7a

6.5746.00
Positive Ranks3b

3.009.00
Ties0c

Total10
a. c < x
b. c > x
c. c = x
Test Statisticsb

c - x
Z-1.886a

Asymp. Sig. (2-tailed).059
Exact Sig. (2-tailed).0
Exact Sig. (1-tailed).032
Point Probability.008
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test
由输出结果可知,单侧精确显著性概率P=0.032< =0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。与手算结果相同。

R语言:

> x=c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.,13.54,14.45)

> wilcox.test(x-8,alt="greater")

        Wilcoxon signed rank test

data:  x - 8 

V = 46, p-value = 0.03223

alternative hypothesis: true location is greater than 0

由输出结果可知,P=0.03223< =0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。与以上结果一致。

二、Mann-Whitney-Wilcoxon检验

下表为8个亚洲国家和8个欧美国家2005年的人均国民收入数据。检验亚洲国家和欧美国家的人均国民收入是否有显著差异(=0.05)。

亚洲国家人均国民收入(美元)欧美国家人均国民收入(美元)
中国1740美国43740
日本380加拿大32600
印度尼西亚1280德国34580
马来西亚4960英国37600
泰国2750法国34810
新加坡27490意大利30010
韩国15830墨西哥7310
印度720巴西3460
数据来源:《统计学(第三版)》 贾俊平

手算:

设亚洲国家为X,欧美国家为Y

建立假设组:

数值组别数值组别
7201X274909X
12802X3001010Y
17403X3260011Y
27504X3458012Y
34605Y3481013Y
49606X3760014Y
73107Y38015X
158308X4374016Y

查表得,Tx=48的右尾概率的2倍为0.019*2=0.038< =0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。

SPSS:

操作:Data——Sort Cases

      Analyze——Nonparametric Tests——2-Independent Samples

Ranks
分组NMean RankSum of Ranks
收入亚洲国家86.0048.00
欧美国家811.0088.00
Total16
Test Statisticsb

收入
Mann-Whitney U12.000
Wilcoxon W48.000
Z-2.100
Asymp. Sig. (2-tailed).036
Exact Sig. [2*(1-tailed Sig.)].038a

Exact Sig. (2-tailed).038
Exact Sig. (1-tailed).019
Point Probability.005
a. Not corrected for ties.
b. Grouping Variable: 分组

由输出结果可知,精确双尾概率P=0.038<=0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。与手算结果一致。

R语言:

> x<-c(1740,380,1280,4960,2750,27490,15830,720)

> y<-c(43740,32600,34580,37600,34810,30010,7310,3460)

> wilcox.test(x,y,exact=F,cor=F)

        Wilcoxon rank sum test

data:  x and y 

W = 12, p-value = 0.03569

alternative hypothesis: true location shift is not equal to 0 

由输出结果可知,P=0.03569< =0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。与以上结果一致。

三、两样本的Kolmogorov-Smirnov检验

下面是13个非洲地区和13个欧洲地区的人均酒精年消费量,试分析这两个地区的酒精人均年消费量是否分布相同。

非洲欧洲
5.386.67
4.3816.21
9.3311.93
3.669.85
3.7210.43
1.6613.54
0.232.4
0.0812.
2.369.3
1.7111.92
2.015.74
0.914.45
1.541.99
数据来源:《非参数统计(第二版)》 吴喜之

手算:

建立假设组:

0.0810100.07692300.076923
0.2310200.15384600.153846
0.910300.23076900.230769
1.5410400.30769200.307692
1.6610500.38461500.384615
1.7110600.46153800.461538
1.9901610.4615380.0769230.384615
2.0110710.5384620.0769230.461538
2.3610810.6153850.0769230.538462
2.401820.6153850.1538460.461538
3.6610920.6923080.1538460.538462
3.72101020.7692310.1538460.615385
4.38101120.8461540.1538460.692308
5.38101220.9230770.1538460.769231
5.74011230.9230770.2307690.692308
6.67011240.9230770.3076920.615385
9.3011250.9230770.3846150.538462
9.331013510.3846150.615385
9.850113610.4615380.538462
10.430113710.5384620.461538
11.920113810.6153850.384615
11.930113910.6923080.307692
12.01131010.7692310.230769
13.5401131110.8461540.153846
14.4501131210.9230770.076923
16.21011313110

查表得,当mnD=130时,双侧检验的概率P<0.01,所以P<=0.05,因此拒绝原假设,即认为这两个地区的酒精人均年消费量分布有显著差异。

SPSS:

操作:Analyze——Nonparametric Tests——2-Independent Samples

Frequencies
分组N
消费量非洲地区

13
欧洲地区

13
Total26
Test Statisticsa

消费量
Most Extreme DifferencesAbsolute.769
Positive.769
Negative.000
Kolmogorov-Smirnov Z1.961
Asymp. Sig. (2-tailed).001
Exact Sig. (2-tailed).000
Point Probability.000
a. Grouping Variable: 分组

由输出结果可知,双侧精确显著性概率P =0.05,因此拒绝原假设,即认为这两个地区的酒精人均年消费量分布有显著差异。与手算结果一致。

四、Cochran Q检验

下面是某村村民对四个候选人(A,B,C,D)的赞同与否的调查(“1”代表同意,“0”代表不同意);最后一列为行总和,最后一行为列总和,全部“1”的总和为42。试分析4位候选人在村民眼中有没有区别(=0.05)。

20个村民对A、B、C、D四个候选人的评价

N
A0110011111111111011116
B1100011111011011000011
C011110000100011010109
D000011001000010110006
L1321232233122333212142
数据来源:《非参数统计(第二版)》 吴喜之

手算:

建立假设组:

查表得,因此在5%的显著性水平上拒绝原假设,即认为4位候选人在村民眼中有显著差异。

SPSS:

操作:Analyze——Nonparametric Tests——K Related Samples

Frequencies
Value
01
A416
B911
C119
D146
Test Statistics
N20
Cochran's Q9.353a

df3
Asymp. Sig..025
Exact Sig..025
Point Probability.006
a. 0 is treated as a success.
由输出结果可知,Q=9.353,精确的显著性概率P=0.025< =0.05,因此拒绝原假设,即认为4位候选人在村民眼中有显著差异。与手算结果一致。

R语言:

> x=read.table("f:/CochranQ.txt")

> n=apply(x,2,sum)

> N=sum(n)

> L=apply(x,1,sum)

> k=dim(x)[2]

> Q=(k*(k-1)*sum((n-mean(n))^2))/(k*N-sum(L^2))

> Q

[1] 9.352941

> pvalue=pchisq(Q,k-1,low=F)

> pvalue

[1] 0.02494840

由输出结果可知,Q=9.352941, P=0.02494840< =0.05,因此拒绝原假设,即认为4位候选人在村民眼中有显著差异。与以上结果一致。

五、Friedman检验

一项关于销售茶叶的研究报告说明销售方式可能和售出率有关。三种方式为:在商店内等待,在门口销售和当面表演炒制茶叶。对一组商店在一段时间的调查结果列再下表中(单位为购买者人数)。试问三种不同的销售方式是否有显著差异(=0.05)。

销售方式购买率(%)
商店内等待2025291817221820
门口销售2623153026322827
表演炒制5347484352574956
数据来源:《非参数统计(第二版)》 吴喜之

手算:

建立假设组:

三种方式购买率等级

销售方式购买率合计
商店内等待1221111110
门口销售2112222214
表演炒制3333333324

查表得,因此在5%的显著性水平上拒绝原假设,即认为三种销售方式有显著差异。

SPSS:

操作:Analyze——Nonparametric Tests——K Related Samples

Ranks
Mean Rank
商店内等待1.25
门口销售1.75
表演炒制3.00
Test Statisticsa

N8
Chi-Square13.000
df2
Asymp. Sig..002
Exact Sig..000
Point Probability.000
a. Friedman Test
由输出结果可知,,精确的显著性概率P<0.001,因此在5%的显著性水平上拒绝原假设,即认为三种销售方式有显著差异。与手算结果一致。

R语言:

> d=read.table("f:/Friedman.txt")

> friedman.test(as.matrix(d))

        Friedman rank sum test

data:  as.matrix(d) 

Friedman chi-squared = 13, df = 2, p-value = 0.001503

由输出结果可知,, P=0.001503<=0.05,因此拒绝原假设,即认为三种销售方式有显著差异。与以上结果一致。

六、K个样本的卡方检验

在一个有三个主要百货商场的商贸中心,调查者问479个不同年龄段的人首先去三个商场中的哪个,结果如下表,检验人们去这三个商场的概率是否一样。

年龄段商场1

商场2

商场3

总和
<30

837045198
30—50

918615192
>50

413810
总和21519470479
数据来源:《非参数统计》 王星

手算:

建立假设组:

分组
<30

83704519888.873 80.192 28.935 0.388 1.295 8.919 
30—50

91861519286.180 77.762 28.058 0.270 0.873 6.077 
>50

41381039.948 36.046 13.006 0.028 0.106 0.695 
合计21519470479215.000 194.000 70.000 0.685 2.274 15.691 

查表得,因为Q=18.651>,因此拒绝原假设,即认为人们去三个商场的概率不同。

SPSS:

操作:Data——Weight Cases

      Analyze——Descriptive Statistics——Crosstabs

Chi-Square Tests
ValuedfAsymp. Sig. (2-sided)Exact Sig. (2-sided)Exact Sig. (1-sided)Point Probability
Pearson Chi-Square18.651a

4.001.b

Likelihood Ratio18.6914.001.001
Fisher's Exact Test18.314.001
Linear-by-Linear Association5.110c

1.024.026.013.003
N of Valid Cases479
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 13.01.
b. Cannot be computed because there is insufficient memory.
c. The standardized statistic is -2.260.
由输出结果可知,卡方统计量为18.651,精确双尾检验概率P=0.01<=0.05,因此拒绝原假设,即认为人们去三个商场的概率不同。与手算结果一致。

七、Kruskal-Wallis检验

某制造商雇用了来自三个本地大学的雇员作为管理人员。最近,公司的人事部门已经收集信息并考核了年度工作成绩。从三个大学来的雇员中随机地抽取了三个样本。制造商想知道是否来自这三个不同的大学的雇员在管理岗位上的表现有所不同。

雇员大学A

大学B

大学C

1256050
2702070
3603060
4851580
5954090
6903570
78075
数据来源: SAS讲义

手算:

建立假设组:

各雇员的成绩等级

雇员大学A

大学B

大学C

1397
212212
3949
417115.5
520618.5
618.5512
715.514
秩和952788
因为出现同分的情况,应对H进行校正,校正系数

查表得,在的显著性水平上,=5.99,由于H=8.9839>=5.99,因此拒绝原假设,即三个总体的考核成绩分布不同。

SPSS:

操作:Analyze——Nonparametric Tests——K Independent Samples

Ranks
分组NMean Rank
成绩大学A

713.57
大学B

64.50
大学C

712.57
Total20
Test Statisticsa,b

成绩
Chi-Square8.984
df2
Asymp. Sig..011
Exact Sig..006
Point Probability.000
a. Kruskal Wallis Test
b. Grouping Variable: 分组

由输出结果可知,KW统计量为8.984,精确概率为0.006,远远小于显著性水平0.05,因此拒绝原假设,即三个总体的考核成绩分布不同。与手算结果一致。

八、列联表卡方检验

一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,得样本数据如下表所示,要求检验地区与原料质量之间有无依赖关系。

 一级二级三级合计
地区15224140
地区2605952171
地区35065741
合计162188150500
数据来源: 统计学教程PPT

手算:

建立假设组:

地区等级
115245.360.97
1252.2.45
1324427.71
216055.40.38
2259.30.44
235251.30.01
315061.242.06
326571.060.52
337456.75.28
合计19.82

查表得,,由于Q=19.82>,因此拒绝原假设,即认为地区与原料质量相关。

SPSS:

操作:Data——Weight Cases

      Analyze——Descriptive Statistics——Crosstabs

地区 * 等级 Crosstabulation

等级Total
一级二级三级
地区地区1

Count5224140
Expected Count45.452.642.0140.0
地区2

Count605952171
Expected Count55.4.351.3171.0
地区3

Count5065741
Expected Count61.271.156.71.0
TotalCount162188150500
Expected Count162.0188.0150.0500.0
Chi-Square Tests
ValuedfAsymp. Sig. (2-sided)Exact Sig. (2-sided)Exact Sig. (1-sided)Point Probability
Pearson Chi-Square19.822a

4.001.b

Likelihood Ratio20.7324.000.000
Fisher's Exact Test20.510.000
Linear-by-Linear Association13.963c

1.000.000.000.000
N of Valid Cases500
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 42.00.
b. Cannot be computed because there is insufficient memory.
c. The standardized statistic is 3.737.
由输出结果可知,检验统计量为19.822,精确双尾显著性概率P远远小于显著性水平0.05,因此拒绝原假设,即认为地区与原料质量相关。与手算结果一致。

九、Kendall秩相关

某研究所对10对双胞胎儿童的智力进行调查,结果如下表:

儿童智力测试得分

双胞胎编号先出生儿童(X)后出生儿童(Y)
197.8
216.619.3
316.220.1
411.37.1
516.213
67.14.8
77.88.9
847.4
911.210
101.31.5
数据来源:《非参数统计:方法与应用》 易丹辉 董寒青

手算:

儿童智力测试得分评秩

XYX的秩Y的秩D
1.31.51100
47.424-24
7.14.83211
7.88.956-11
97.85500
11.21067-11
11.37.173416
16.220.18.510-1.52.25
16.2138.580.50.25
16.619.310911

对T的显著性进行检验,建立假设组:

查表得,n=10,T=0.6667或T=0.6742相应的概率在0.0002至0.0005之间,远远小于显著性水平0.05,因此拒绝原假设,即认为双胞胎儿童的智力之间存在着正相关。

SPSS:

操作:Analyze——Correlate——Bivariate

Correlations
先出生儿童后出生儿童
Kendall's tau_b

先出生儿童Correlation Coefficient1.000.674**

Sig. (2-tailed)..007
N1010
后出生儿童Correlation Coefficient.674**

1.000
Sig. (2-tailed).007.
N1010
**. Correlation is significant at the 0.01 level (2-tailed).
由输出结果可知,T=0.674,双侧检验的显著性概率为0.007,则单侧的显著性概率为0.0035,远远小于显著性水平0.05,因此拒绝原假设,即认为双胞胎儿童的智力之间存在着正相关。与手算结果一致。

R语言:

> x=c(9.0,16.6,16.2,11.3,16.2,7.1,7.8,4.0,11.2,1.3)

> y=c(7.8,19.3,20.1,7.1,13.0,4.8,8.9,7.4,10.0,1.5)

> cor.test(x,y,method="kendall")

        Kendall's rank correlation tau

data:  x and y 

z = 2.6941, p-value = 0.007058

alternative hypothesis: true tau is not equal to 0 

sample estimates:

      tau 

0.6741999 

警告信息:

In cor.test.default(x, y, method = "kendall") : 无法给连结计算精確p值

由输出结果可知,T=0.6741999,P=0.007058,远远小于显著性水平0.05,因此拒绝原假设,即认为双胞胎儿童的智力之间存在着正相关。与以上结果一致。

十、完全秩评定的Kendall协和系数

下面是4个的环境研究单位对10个城市空气等级排序的结果,试分析这4个评估机构的结果是否是随机的。

评估机构(m=4)

被评估的10个城市(A-J)的排名

ABCDEFGHIJ
A

B

C

D

9

10

8

9

2

1

4

1

4

3

2

2

10

8

10

10

7

7

9

6

6

5

7

7

8

9

5

4

5

6

6

8

3

4

3

5

1

2

1

3

R368113829252625157
数据来源:《非参数统计(第二版)》 吴喜之

手算:

对W进行显著性检验,建立假设组:

查表得,因此拒绝原假设,即认为这些评估之间是显著相关的。

SPSS:

操作:Analyze——Nonparametric Tests——K Related Samples

Ranks
Mean Rank
A9.00
B2.00
C2.75
D9.50
E7.25
F6.25
G6.50
H6.25
I3.75
J1.75
Test Statisticsb

N4
Kendall's Wa

.853
Chi-Square30.709
df9
Asymp. Sig..000
a. Kendall's Coefficient of Concordance

b. Some or all exact significances cannot be computed because there is insufficient memory.
由输出结果可知,W=0.853,Q=30.709,P远远小于显著性水平0.05,因此拒绝原假设,即认为这些评估之间是显著相关的。与手算结果一致。

R语言:

> d=read.table("f:/airp.txt") 

> R=apply(d,2,sum)

> m=nrow(d)

> n=ncol(d)

> S=sum((R-m*(n+1)/2)^2)

> W=12*S/m^2/(n^3-n)

> W

[1] 0.8530303

> pchisq(m*(n-1)*W,n-1,low=F)

[1] 0.0003320349

由输出结果可知,W=0.8530303,P= 0.0003320349,远远小于显著性水平0.05,因此拒绝原假设,即认为这些评估之间是显著相关的。与以上结果一致。

文档

非参数统计十道题

非参数统计----十道题09统计学王若曦32009121114一、Wilcoxon符号秩检验下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数,数据已经按升序排列:4.125.817.639.7410.3911.9212.3212.13.5414.45人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,试用上述数据检验这种看法。数据来源:《非参数统计(第二版)》吴喜之手算:建立假设组:编号纯酒精数xD=x-8|D||D|的秩D的符号14.12-3.883.885-25.81-
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top