
1、两样本的Wilcoxon秩和检验
由Mann,Whitney和Wilcoxon三人共同设计的一种检验,有时也称为Wilcoxon秩和检验,用来决定两个样本是否来自相同的或相等的总体。如果这两个样本来自正态分布和具有相同方差时,我们可以采用t检验比较均值。但当这两个条件都不能确定时,我们常替换t检验法为Wilcoxon秩和检验。
Wilcoxon秩和检验是基于样本数据秩和。先将两样本看成是单一样本(混合样本)然后由小到大排列观察值统一编秩。如果原假设两个样本来自相同的总体为真,那么秩将大约均匀分布在两个样本中,即小的、中等的、大的秩值应该大约均匀被分在两个样本中。如果备选假设两个样本来自不相同的总体为真,那么其中一个样本将会有更多的小秩值,这样就会得到一个较小的秩和;另一个样本将会有更多的大秩值,因此就会得到一个较大的秩和。
设两个样本为:第一个的样本容量为,第二个样本容量为,在容量为的混合样本(第一个和第二个)中,样本的秩和为,样本的秩和为,且有
| (28.1) |
| (28.2) | |
| (28.3) |
一个具有实际价值的方法是,对于每个样本中的观察数大于等于8的大样本来说,我们可以采用标准正态分布来近似检验。由于的中心点为,根据(28.2)式,中心点为
| (28.4) |
| (28.5) |
| (28.6) |
| (28.7) |
例28.1某航空公司的CEO注意到飞离亚特兰大的飞机放弃预定座位的旅客人数在增加,他特别有兴趣想知道,是否从亚特兰大起飞的飞机比从芝加哥起飞的飞机有更多的放弃预定座位的旅客。获得一个从亚特兰大起飞的9次航班和从芝加哥起飞的8次航班上放弃预定座位的旅客人数样本,见表28.1中的第2列和第4列所示。
表28.1 放弃预定座位的旅客人数及统一秩值
航班
| 次数 | 亚特兰大(组) | 芝加哥(组) | ||
| 放弃人数 | 统一编秩 | 放弃人数 | 统一编秩 | |
| 1 | 11 | 5.5 | 13 | 7 |
| 2 | 15 | 9 | 14 | 8 |
| 3 | 10 | 3.5 | 10 | 3.5 |
| 4 | 18 | 12 | 8 | 1 |
| 5 | 11 | 5.5 | 16 | 10 |
| 6 | 20 | 13 | 9 | 2 |
| 7 | 24 | 16 | 17 | 11 |
| 8 | 22 | 15 | 21 | 14 |
| 9 | 25 | 17 | ||
| 秩和 | 96.5 | 56.5 | ||
注意到9, 8, =96.5, =56.5,两组放弃预定座位旅客人数的分布是相同的。标准正态分布值的计算结果为
如果设定显著水平0.05,我们知道标准正态分布在0.05显著水平时,上临界值为1.5,下临界值为-1.5,由于1.445<1.5,所以不能拒绝原假设。
在使用Wilcoxon秩和检验时,也可以采用第二个样本的秩和来计算标准正态分布值,但要注意公式中和的对换。值的计算结果为
由于-1.445>-1.5,所以得到是相同的结果,不能拒绝原假设。
另外,要特别注意的是由于在连续型分布中随机地抽出个样本,几乎极少可能存在有些值相等的情况,但在社会经济中有很多离散变量,很可能存在数值相同的情况,即样本中存在着“结”。我们处理“结”的方法采用分享平均秩,但当大量“结”存在时,将可能直接影响的方差,因此需要把(28.5)式中的方差修正为(28.6)。但在手工计算和结值不多的情况下,常使用未修正方差来简化计算,因为与修正方差的计算结果比较只存在一些小差异,大多数情况下不影响最终的推断结果。
2、单因子非参数方差分析的npar1way过程
单因子非参数方差分析的npar1way过程是分析变量的秩,并计算几个基于经验分布的函数(EDF)和通过一个单因子分类变量的响应变量确定的秩得分的统计量。秩的得分计算分成四种:Wilcoxon得分、中位数得分、Savage得分和Van der Waerden得分。然后再由秩得分计算简单的线性秩统计量,由这个秩统计量可以检验一个变量的分布在不同组中是否具有相同的位置参数,或者在EDF检验下,检验这个变量分布在不同组中是否分布相同。秩得分的统计量也可以先用proc rank过程计算秩得分,然后用proc anova过程分析这些秩得分而得到。
1. 四种不同的秩得分计算
用以下公式定义的统计量
| (28.8) |
1)Wilcoxon得分
在Wilcoxon得分中
| = | (28.9) |
2)Median得分
Median得分又称为中位数得分。当观察的秩大于中位点时,中位数得分为1,否则为0,即
| (28.10) |
3)Van der Waerden得分
Van der Waerden得分简称为VW的得分。它是对正态分布的次序统计量的期望值的近似,即
| = | (28.11) |
4)Savage得分
Savage得分是指数分布的次序统计量的期望值。减去1使得得分以0为中心,既
| = | (28.12) |
2. npar1way过程说明
proc npar1way过程一般由下列语句控制:
| proc npar1way data=数据集 <选项>; |
| class 分类变量; |
| var 变量列表; |
| by 变量列表 ; |
| run ; |
1)proc npar1way语句的选项
anova——对原始数据执行标准方差分析。
edf——计算基于经验分布函数(EDF)的统计量,如Kolmogorov-Smirnov、Cramer-Von Meses、Kuiper统计量。
missing——把class变量的缺失值看作一个有效的分类水平。
median——执行一个中位数得分分析。对于两样本产生一个中位数检验,对于更多样本产生一个Brown-Mood检验。
savage——执行一个Savage得分分析。该检验适用于数据服从指数分布的组间比较。
vw——执行一个Van der Waerden得分分析。这是一个通过应用反正态分布累积函数得到近似的正态得分。对于两个水平情况,这是一个标准Van der Waerden检验。
wilcoxon——对数据或Wilcoxon得分进行秩分布。对于两个水平,它与Wilcoxon秩和检验一样;对于任何数量的水平,这是一个Kruskal-Wallis检验。对于两样本情况,该过程使用一个连续的校正。
2)class语句
class语句是必需的,它指定一个且只能一个分类变量。该变量用来标识数据中的各个类。Class语句变量可以是字符型或数值型。
3)var语句
var语句命名要分析的响应变量或自变量。如果省略var语句,过程分析数据集中除class语句指定的数据变量外的所有数值型变量。
4)by语句
一个by语句能够用来得到由by变量定义的几个观察组,并用proc npar1way过程分别进行分析。当一个by语句出现时,过程希望输入的数据集已按by变量排序。
3、实例分析
例28.1的SAS程序如下:
| data study.noshows ; |
| do group=1 to 2; |
| input n; |
| do i=1 to n; |
| input x @@; |
| output; |
| end; |
| end; |
| cards; |
| 9 |
| 11 15 10 18 11 20 24 22 25 |
| 8 |
| 13 14 10 8 16 9 17 21 |
| ; |
| proc npar1way data=study.noshows wilcoxon; |
| class group; |
| var x; |
| run; |
N P A R 1 W A Y P R O C E D U R E
Wilcoxon Scores (Rank Sums) for Variable X
Classified by Variable GROUP
Sum of Expected Std Dev Mean
GROUP N Scores Under H0 Under H0 Score
1 9 96.5000000 81.0 10.3795614 10.7222222
2 8 56.5000000 72.0 10.3795614 7.0625000
Average Scores Were Used for Ties
Wilcoxon 2-Sample Test (Normal Approximation)
(with Continuity Correction of .5)
S = 56.5000 Z = -1.44515 Prob > |Z| = 0.1484
T-Test Approx. Significance = 0.1677
Kruskal-Wallis Test (Chi-Square Approximation)
CHISQ = 2.2300 DF = 1 Prob > CHISQ = 0.1354
表28.2 用npar1way过程进行Wilcoxon秩和检验的输出结果
结果说明:组1和组2的秩和(Sum of Scores)分别为96.50和56.50。原假设(组1和组2的总体分布相同)为真时,期望秩值(Expected)分别为(96.50+56.50)×9/(9+8)=81.0和(96.50+56.50)×8/(9+8)=72.0,标准差(Std Dev)按公式(28.6)计算为10.3795614。每组平均得分(Mean Score)分别为96.50/9=10.7222222和56.50/ 8=7.0625000。Wilcoxon两样本秩和统计量(较小的秩和)S = 56.5000,正态近似检验统计量Z = -1.44515(连续性修正因子为0.5,加在分子上),正态分布的双尾p值之和为0.1484,不能拒绝原假设。同时还给出了近似t检验和卡方检验的结果:近似t检验的p=0.1677,近似卡方检验统计量为2.2300,自由度为1,p=0.1354。结果都是相同的,不能拒绝原假设。
