
第五章 相关和回归
§1 引言
所谓相关,是指两组或两组以上观察结果之间的连带性或联系。换句话说,也就是各组观察结果所反映的特性之间有关系。如几个亲生兄弟间的智商与出生顺序有关系,受教育程度与性别有关系,出生率X和文盲率Y之间的关系等等。在实际问题的研究中,人们常常想知道两组或两组以上的观察结果是否有联系,同时也想知道联系的程度如何。前面的统计检验能够在一定的显著性水平上,确定各组观察值的关系是否存在。
相关方法被用来度量两个或更多变量之间的线性关系的强度,是回归分析的基础。
在数理统计学中,我们使用相关系数定义变量X和变量Y之间的相关性。
对于样本,,……,来说,Pearson相关系数为
如果在这个样本中的n个观察值,则r是的渐近无偏估计;如果它又是二元正态分布,则r是的ML估计。
为了检验,,可以选取统计量
结论:Pearson相关系数度量的是一种线性关系,而我们所要介绍的非参数的Spearman秩相关系数和Kendall τ相关系数实际上度量的是一种形式的相依联系,或是更广义的单调关系。因此相关的概念被推广,不仅指线性相关,而泛指相依或联系。
§2 两个样本的相关分析
一、等级相关
等级相关(Rank Correlation)也称作级序相关,用于两个至少是定序尺度测量的样本问相关程度的测定研究背景
1.基本方法
两个样本X、Y,其观察数据可以配对为,,……,。将排序后评秩,其秩记作U,与相对应的秩为;同样,排序后评秩,秩记作V,与相对应的秩为。这样得到的n对秩,,…,可能每一对完全相等,也可能不等。由于每一样本都是n个数据评秩,因此与的取值都是从1到n。X、Y的秩可能完全一致,即对于所有的i来说,有=,表5—1是完全一致的评秩结果。X、Y的秩可能完全相反,表5—2是完全相反的评秩结果。如果X、Y完全相关,应该对于所有的i有=,即—=0。因此,与之差可以用来度量X、Y的相关程度。定义
表5-1 完全一致的评秩
| X的秩 | Y的秩 |
| 1 | 1 |
| 2 | 2 |
| … | … |
| n-1 | n-1 |
| n | n |
| X的秩 | Y的秩 |
| 1 | n |
| 2 | n-1 |
| … | … |
| n-1 | 2 |
| n | 1 |
(5.3)式的这个秩差值平方和的大小既受到n的多少的影响,又受到两组秩不一致程度的影响,因此,采用相对的测量指标有利于说明X、Y的相关程度。因为的最大值反映X、Y完全不相关的情况,所以,用(5.3)式除以的最大值,可用来评价X、Y之间秩的差值是否与完全不相关时接近。若实际计算的与X、Y完全不相关情况下的接近,那么两个样本的相关程度较低,若实际计算的与最大值的比越小,则两个样本的相关程度越高。的最大值即X、Y间完全不相关情况下的秩差值平方和,可以根据表5—2所列的数据计算。因为这是X、Y完全不相关的评秩结果。的最大值为
(5.4)式的中括号内最后一项,当n为奇数时是22;n为偶数时是12。
(5.3)式除以(5.4)式得到
(5.5)式的取值从0到1。根据表5-1中的数据计算(5.5)式值为0,表5-2中的数据计算的(5.5)式值为1,即X、Y的秩完全一致时,(5.5)式的值为0,X、Y的秩完全不一致时,(5.5)式的值为1。
测度两个样本等级相关程度可以象参数方法一样,定义等级相关系数作为标准。斯皮尔曼的等级相关系数(Spearman coefficient of rank correlation)是测定两个样本相关强度的重要指标。其计算公式为
斯皮尔曼相关系数也写为,在有下标注以s是为表明这个相关系数r不是积矩相关的简单相关系数,而是等级相关的Spearman相关系数。
注:①由于(5.6)式与(5.5)式不同,所以,R的取值从一1到十1,表明X、Y完全相关,R=十l为完全正相关,R=一1为完全负相关。越接近于l,表明相关程度越高,反之,越接近于零,表明相关程度越低,R=0为完全不相关。R>0为正相关,R<0为负相关。通常认为为相关程度较高。
②Spearman秩相关系数检验临界值查表可得,P198。
③存在打结时,Spearman统计量要作相应修正。
④在大样本时,可用正态近似作检验。
2.应用
【例5-1】经济发展水平和卫生水平之间的相关分析
对某地区12个街道进行调查,并对经济发展水平和卫生水平按规定的标准打分,评定结果如表5—4。
表5-4 某地区经济水平与卫生水平得分
| 街道号 | 经济水平 | 卫生水平 | 街道号 | 经济水平 | 卫生水平 |
| 1 | 82 | 86 | 7 | 84 | 80 |
| 2 | 87 | 78 | 8 | 78 | 77 |
| 3 | 60 | 65 | 9 | 80 | 75 |
| 4 | 98 | 88 | 10 | 94 | 96 |
| 5 | 75 | 11 | 85 | 85 | |
| 6 | 90 | 12 | 68 | 70 |
由于R=0.888l>0.8,所以该地区的经济发展水平和卫生水平存在着正相关关系,相关程度较高,为88.81%。
表5-5 某地区经济水平与卫生水平得分
| 街道号 | 经济水平(U) | 卫生水平(V) | D=U-V | D2 |
| 1 | 6 | 9 | -3 | 9 |
| 2 | 9 | 6 | 3 | 9 |
| 3 | 1 | 2 | -1 | 1 |
| 4 | 12 | 10 | 2 | 4 |
| 5 | 3 | 1 | 2 | 4 |
| 6 | 10 | 11 | -1 | 1 |
| 7 | 7 | 7 | 0 | 0 |
| 8 | 4 | 5 | -1 | 1 |
| 9 | 5 | 4 | 1 | 1 |
| 10 | 11 | 12 | -1 | 1 |
| 11 | 8 | 8 | 0 | 0 |
| 12 | 2 | 3 | -1 | 1 |
| 合 计 | 32 |
当观察值是评的分数时,可能在同一个样本中出现相同的评分,如成绩都是80等等。同分的秩仍旧是等于几个同分值应有秩的平均值。如果同分的比例不大,它们对秩相关系数及的影响可以忽略。但若同分的比例较大,则计算只时应加入一个校正因子。对于X的同分校正因子为,Y的同分校正因子为。于是斯皮尔曼秩相关系数的计算公式为:
式中,u是X中同分的观察值数目,v是Y中同分的观察值数目。
【例5-2】经济发展水平和卫生水平之间的相关分析
某地区对24个区县进行调查,并对经济发展水平和卫生水平按规定标准评分,结果如表5—6。
分析:将表5—6的评分转换为秩次,从高往低排序,同分的秩取平均值,结果见表5—7。根据公式5.6计算
由于经济水平和卫生水平的评分中均有同分,应采用校正因子修正。利用5.7式计算修正的R为
对比两个R值可知,由于同分的观察值数目占观察值总数目的比例不是很大,因而校正后的R与校正前的R变化不大。但是,校正前的只略大于校正后的R,这说明同分对只的影响虽然很小,但同分的影响是夸大R值。因此。在X、Y中至少有一个存在大量同分时,应进行校正。
表5-6 经济水平与卫生水平评分
| 区县编号 | 经济水平(X) | 卫生水平(Y) | 区县编号 | 经济水平(X) | 卫生水平(Y) |
| 1 | 92 | 56 | 13 | 68 | 55 |
| 2 | 90 | 70 | 14 | 67 | 66 |
| 3 | 90 | 71 | 15 | 65 | 59 |
| 4 | 87 | 76 | 16 | 58 | |
| 5 | 81 | 69 | 17 | 61 | 50 |
| 6 | 80 | 68 | 18 | 60 | 54 |
| 7 | 79 | 62 | 19 | 59 | 43 |
| 8 | 77 | 70 | 20 | 55 | 45 |
| 9 | 76 | 21 | 46 | 34 | |
| 10 | 76 | 63 | 22 | 42 | 32 |
| 11 | 74 | 54 | 23 | 39 | 30 |
| 12 | 68 | 65 | 24 | 38 | 31 |
| 区县编号 | X的秩次(U) | Y的秩次(V) | D=U-V | D2 |
| 1 | 1 | 14 | -13 | 169 |
| 2 | 2.5 | 3.5 | -1 | 1 |
| 3 | 2.5 | 2 | 0.5 | 0.25 |
| 4 | 4 | 1 | 3 | 9 |
| 5 | 5 | 5 | 0 | 0 |
| 6 | 6 | 6 | 0 | 0 |
| 7 | 7 | 11 | -4 | 16 |
| 8 | 8 | 3.5 | 4.5 | 20.25 |
| 9 | 9.5 | 9 | 0.5 | 0.25 |
| 10 | 9.5 | 10 | -0.5 | 0.25 |
| 11 | 11 | 16.5 | -5.5 | 30.25 |
| 12 | 12.5 | 8 | 4.5 | 20.25 |
| 13 | 12.5 | 15 | -2.5 | 6.25 |
| 14 | 14 | 7 | 7 | 49 |
| 15 | 15 | 12 | 3 | 9 |
| 16 | 16 | 13 | 3 | 9 |
| 17 | 17 | 18 | -1 | 1 |
| 18 | 18 | 16.5 | 1.5 | 2.25 |
| 19 | 19 | 20 | -1 | 1 |
| 20 | 20 | 19 | 1 | 1 |
| 21 | 21 | 21 | 0 | 0 |
| 22 | 22 | 22 | 0 | 0 |
| 23 | 23 | 24 | -1 | 1 |
| 24 | 24 | 23 | 1 | 1 |
| 合计 | 347.00 |
利用相关系数及其修正的公式计算的R值,是抽自两个总体的样本数据计算的结果,从这一相关系数的大小,可猜测总体的秩相关系数是否与零有显著差异,但是否为真,应进行假设检验。对R的显著性检验正是为了回答这一问题。检验可以仅研究两个总体是否存在相关,也可以分别研究相关的方向,即是正相关,还是负相关。针对研究问题的不同,可以建立不同的假设组。
双侧检验
H0:不相关
H1:存在相关
单侧检验
H0:不相关 H0:不相关
H+:正相关 H-:负相关
为对假设作出判定,所需数据至少是定序尺度测量的。根据前式计算出R值。当时,在附表中,依据n和R查找相应的概率P。表5—8是判定指导表。
表5-8 R显著性检验判定指导表
| 备 择 假 设 | P-值 |
| H+:正相关 | R的右尾概率 |
| H-:负相关 | R的左尾概率 |
| H1:存在相关 | R的较小概率的2倍 |
【例5-3】对例5—3作显著性检验
分析:由于例5—3中未指明相关的方向,只需检验是否相关,因而建立双侧备择:
H0:不相关
H1:存在相关
利用提供的数据计算的R值为0.8491,每个样本数据n为24。在附表中n=24时;双侧检验的概率为0.002。显然,R=0.849l>。因此,概率P<0.002,数据拒绝H0,表明经济水平和卫生水平确实存在相关关系。
二、Kendall τ相关检验
Kendall秩相关即肯德尔秩相关,与等级相关一样,也是用于两个样本相关程度的测量,要求数据至少是定序尺度的。它也是利用两组秩次测定两个样本问相关程度的一种非参数统计方法。
1.基本概率
协同(concordant,一致):在样本和样本中,如果,则对子与协同;如果,则对子与不协同。
2.基本方法
n个配对数据,,……,分别抽选自X、Y,X、Y都至少是可以用定序尺度测量的。将X的n个数据的秩按自然顺序排列,则Y的n个秩也相应地发生变动。例如,X、Y的秩分别为
| X | 2 | 4 | 3 | 5 | 1 |
| Y | 3 | 4 | 1 | 5 | 2 |
| X | 1 | 2 | 3 | 4 | 5 |
| Y | 2 | 3 | 1 | 4 | 5 |
表5-9 R显著性检验判定指导表
| Y的数对 | 分 数 | 总 和 |
| 2,3 | 1 | 8个+ |
| 2,1 | -1 | 2个- |
| 2,4 | 1 | |
| 2,5 | 1 | |
| 3,1 | -1 | |
| 3,4 | 1 | |
| 3,5 | 1 | |
| 1,4 | 1 | |
| 1,5 | 1 | |
| 4,5 | 1 |
若以U表示Y的一致对数目,V表示Y的非一致对数目,则一致对评分与最大可能总分之比为
非一致对评分与最大可能总分之比为
当Y的秩对完全按自然顺序排列时,(5.9)式的值为1,(5.10)式的值为0;而当Y的秩对全部为非一致对时,(5.10)式的值为1,(5.9)式的值为0。为测定两组秩之间的相关程度,定义的相关系数从一1到十1,因此,Kendall秩相关系数为
若记S=U一V,则Kendall秩相关系数为
这里的Kendall秩相关系数T是Tau的缩写,也常写作τ。T=l,表明两组秩次完全正相关;T=一1,表明两组秩次间完全负相关。一般,可以为相关程度较高。
NOTE:①该定义式实质为概率,;详见笔记P40
②S和T等价;
③S的计算;
④小样本时,可以查表;大样本时,可以作正态近似:。
⑤存在打结时,进行同分的处理。
3.应用
【例5-4】利用例5-2的数据资料分析经济水平和卫生水平的相关程度
分析:根据表5—5的评秩结果进行秩次重新排列,将经济水平的秩次按自然顺序排列,得表5—10的结果。由表可以计算得到2、3、1、5、4、9、7、8、6、11的一致对数目
根据(5—11)式计算有
由表可以计算出非一致对的数目V为
V=1十1十1十3十1十1十1十1=10
根据(5—12)式计算有
若根据(5—13)式计算,也可以得到同样的结论。
T=0.6970<0.8,表明经济水平与卫生水平相关程度不够高。
Kendall秩相关系数也可以用于定距尺度测量的数据,数据不必评秩,而直接比较大小得到一致对或非一致对的数目。
表5-10 经济水平和卫生水平秩的排序
| 街道编号 | 经济水平的秩 | 卫生水平的秩 | 街道编号 | 经济水平的秩 | 卫生水平的秩 |
| 3 | 1 | 2 | 7 | 7 | 7 |
| 12 | 2 | 3 | 11 | 8 | 8 |
| 5 | 3 | 1 | 2 | 9 | 6 |
| 8 | 4 | 5 | 6 | 10 | 11 |
| 9 | 5 | 4 | 10 | 11 | 12 |
| 1 | 6 | 9 | 4 | 12 | 10 |
4.同分的处理
当两个样本中无论哪一个或者两个均有同分观察值时,仍采用通常的办法,将每一个同分观察值的秩记作其应有秩的平均值。由于同分的影响,也需要对了计算公式中的分母进行校正。在同分情况下,(5.13)式应变为
式中,,u是X中同分观察值的数目,,u是X中同分观察值的数目。u,v仍分别表示X、Y的每一同分组中同分观察值的数目。
表5-11 两个裁判员的秩的评分
| X的数对 | Y的数对 | 分 数 | 总 和 |
| 1,2.5 | 2,3.5 | 1 | 5个加 |
| 1,2.5 | 2,3.5 | 1 | 3个减 |
| 1,4.5 | 2,1 | -1 | |
| 1,4.5 | 2,5 | 1 | |
| 2.5,2.5 | 3.5,3.5 | 0 | |
| 2.5,4.5 | 3.5,1 | -1 | |
| 2.5,4.5 | 3.5,5 | 1 | |
| 2.5,4.5 | 3.5,1 | -1 | |
| 2.5,4.5 | 3.5,5 | 1 | |
| 4.5,4.5 | 1,5 | 0 |
与Spearman秩相关系数R一样,Kendall秩相关系数T的显著性也应进行检验。这一检验实际上是检验两个总体的相关是否真实存在,是正相关或是负相关,从而说明以T的大小反映相关程度的高低是可信。如果研究关心的是相关是否确实存在,而不考虑相关的方向,则应建立双侧备择,假设组为
H0:不相关
H1:存在相关
若关心的是相关的方向,则应建立单侧备择,假设组为
H0:不相关 H0:不相关
H+:正相关 H-:负相关
为对假设作出判定,所需数据至少是定序尺度测量的。通过对数据求出一致对或非一致对数目,可以按照计算公式算出Kendall秩相关系数T。
(1)小样本时,可以查表给出尾概率,T的抽样分布中附表中给出。
表5-12 T显著性检验判定指导表
| 备 择 假 设 | P-值 |
| H+:正相关 | T的右尾概率 |
| H-:负相关 | T的左尾概率 |
| H1:存在相关 | T的较小概率的2倍 |
由于Z近似正态分布,故可以查标准正态分布表找到相应的尾概率。
三、等级相关系数R和Kendall秩相关系数T的比较
1.相同点
①两个相关系数的检验都要求数据至少是在定序尺度上测量;
②都是计算秩相关系数,用以测度两个相关样本之间的相关程度;
③它们的取值都是在-1到+1之间;
2.不同点
①R和T的数值即使对于同一组数据也是不同的,多数情况下,R的绝对值大于T的绝对值;
②虽然R和T都使用了资料中同量的信息,但由于两者具有不同的基础尺度,R利用的是秩差,而T利用的是秩的顺序,即一致对和非一致对,因此,不能将它们的数值加以比较,以说明相关程度的高低。
③T的解释比起R来更容易。两个观察的数对,,当时,总有,称为顺序一致对,若对于每个,都有,则为不一致对。T的准确意义是:一致对数目与非一致对数目之差占全部可能数对的比重。
§3 k个样本的相关分析
前面一章研究的是n个对象或个体的两组秩之间相关的度量,在实际问题中,往往还涉及n个对象或个体的几组秩评定之间的相关。对于至少是定序尺度测量的k个配对样本的数据,或k次试验得到的数据,其秩评定间的相关,可以采用Kendall秩评定协同系数度量。本章主要介绍两种Kendall秩评定协同系数:完全秩评定协同系数和不完全秩评定协同系数。
一、完全秩评定的Kendall协同系数
完全秩评定的Kendall协同系数(Kendall Coefficient of Concordancefor ComPlete Rankings)用于是组秩评定间相关程度的测定,即多组秩之间关联程度的测定。
1.基本方法
若被分析的数据是定序尺度测量的,那么n个数据,即n个对象或个体,可以分别给予某一个秩,在这一组数据内所有的秩次和即等级和为
如果有k组秩,那么这k组秩的秩次总和就是。
例如3个消费者分别给6种牌号电冰箱的质量评等级,结果如表5—14。表中最后一行是每一种牌号电冰箱的秩和,总的秩和为。这也就是最大可能的秩次和。这时,对于每一个观察对象或个体来说,平均的秩次和应为
表5-14 消费者给冰箱质量评定的秩
| 消费者 | 冰箱A | 冰箱B | 冰箱C | 冰箱D | 冰箱E | 冰箱F |
| 1 | 1 | 6 | 3 | 2 | 5 | 4 |
| 2 | 1 | 5 | 6 | 4 | 2 | 3 |
| 3 | 6 | 3 | 2 | 5 | 4 | 1 |
| 秩和() | 8 | 14 | 11 | 11 | 11 | 8 |
在k组秩评定完全一致时,各个观察对象或个体的秩和与平均秩和的离差平方和,是最大可能的离差平方和。由于k组秩评定完全一致时,各观察对象或个体的秩和分别为k,2k,…,nk,如表5—14,如果3位消费者对6种牌号电冰箱的质量看法一致,那么他们会给出相同的秩。这时,被认为质量最好的电冰箱将得到3个秩1,它们的秩和Rj=1十1十1=3=k。被认为质量第二的,秩和Rj=2十2十2=6=2k。最差的电冰箱秩和将是Rj=6十6十6=18=nk。也就是说,当k组秩评定之间完全一致的时候,Rj应是k,2k,…,nk。因此,最大可能的离差平方和为
实际偏差平方和与最大可能偏差平方和之比,在一定程度上能反映k组秩评定间的一致性,即协调程度。(5.16)式除以(5.17)式得到Kendall完全秩评定协同系数W。
W的取值在0到1之间。若W=0,表明k组秩之间不相关;若W=1,表明k组秩之间完全相关,即完全一致。由于k>2时,k组秩评定不可能完全不一致,也就是说,只有当k=2时,秩评定一致和非一致是对称相反的,而k>2,对称性不再存在,因此,W取值不可能为负。
为方便实际计算,(5.18)式还可以写成下面的形式
NOTE:①在m组秩的评定完全一致时,该离差平方和是最大可能的离差平方和,实际上,个体的秩和分别为:k,2k,…,nk。
②最大可能的离差平方和为:
③完全评秩的协同系数W,实际表达了实际偏差平方和和最大可能偏差平方和之比,在一定程度上反映了k组评秩之间的一致性,即协同程度。
④。当W=0时,表明k组秩之间不相关;若W=1,表明k组秩之间完全相关,即完全一致。
⑤在作检验时,W统计量和S统计量都有表可查;当大样本时,有
2.应用
【例5-8】裁判组整体评分效果的相关分析
在某次业余歌手大赛上,6名裁判员组成的裁判组,对10名参赛歌手的评分等级如表5—15。
表5-15 裁判员对歌手评定的等级
| 歌手编号 | 裁判员A | 裁判员B | 裁判员C | 裁判员D | 裁判员E | 裁判员F |
| 1 | 1 | 1 | 1 | 1 | 1 | 5 |
| 2 | 2 | 3 | 7 | 5 | 8 | 3 |
| 3 | 5 | 4 | 6 | 2 | 6 | 9 |
| 4 | 9 | 7 | 5 | 4 | 10 | 6 |
| 5 | 4 | 5 | 3 | 6 | 5 | 8 |
| 6 | 6 | 6 | 4 | 7 | 7 | 2 |
| 7 | 3 | 2 | 9 | 10 | 2 | 4 |
| 8 | 7 | 10 | 10 | 3 | 4 | 1 |
| 9 | 10 | 8 | 2 | 9 | 9 | 7 |
| 10 | 8 | 9 | 8 | 8 | 3 | 10 |
表5-16 裁判员对歌手评定的等级
| 歌手编号 | ||
| 1 | 10 | 100 |
| 2 | 28 | 784 |
| 3 | 32 | 1024 |
| 4 | 41 | 1681 |
| 5 | 31 | 961 |
| 6 | 32 | 1024 |
| 7 | 30 | 900 |
| 8 | 35 | 1225 |
| 9 | 45 | 2025 |
| 10 | 46 | 2116 |
| 合 计 | 330 | 11840 |
一般来说,W的值越接近于l,表明k组秩评定之间的一致程度越高;W值越接近于0,则k组秩评定之间的一致程度就越低。这里,W=0.6865,不算很大,表明裁判组6名裁判员对10名参赛歌手水平的意见一致程度不是很高。
3.同分的处理
详见易丹辉编《非参数统计—方法与应用》P134。
当存在同分时,(5.17)变为
(5.18)和(5.19)的分母变为
校正后的Kendall完全秩评定协同系数W为
4.W的显著性检验
对W显著性的检验,是为了对总体间是否存在真实的相关关系作出判定。由于是k个样本,只能建立双侧备择,假设组为
H0:不相关
H1:存在相关
为了对假设作出判定,需要容量均为n的k个样本数据至少是在定序尺度上测量的,每一观察值都能有相应的秩。
检验统计量因样本的大小而有所不同。当样本的观察值n较小时,采用的检验统计量为S。
当样本观察值数目n较大时,采用Q统计量。
小样本时,检验统计量S在H0为真时的抽样分布,可以参见附表。大样本时,可以查卡方分布表得到其相应的尾概率的值。
【例5-9】对上例的W值进行显著性检验
分析:因为在这个问题中,n=l0,k=6,所以应利用W值计算统计量Q,根据(5.21)式计算得到
根据自由度df=n一l=9,显著性水平,在方分布中查找得到=16.92。由于
Q=13.1976<=l6.92
所以数据在5%的水平上不能拒绝H0,表明6名裁判员所作的秩评定彼此不相关。
二、不完全秩评定的Kendall协同系数
在实际问题中,往往会遇到这样的情况,如在参赛的10名歌手中,只评出6名排等级;在对几种消费品质量评级时,消费者只评出其中最满意的3种等等。这时,不是所有配对样本的每个观察值都被分配等级,也就是秩的评定不完全。研究这种情况下,裁判员评分效果的一致程度,消费者对产品质量满意的一致程度等,不能采用上节所述的Kendall协同系数,而应采用本节介绍的不完全秩评定的Kendall协同系数。
1.基本方法
若被分析的数据是k个组,即k个样本,每组均含有n个观察值,对每组观察值评定的秩不是n个而是m个,且m<n,则构成不完全秩评定的情况,可以考虑采用不完全秩评定的Kendall协同系数,但在使用时,通常有这样的,即对于m,n,k以及λ来说,应该是匹配的,即满足下式。
式中,λ是配对样本被比较的次数。例如,3个消费者对3种牌号的彩电质量评等级,若3种脾号的彩电仅一次被比较,则λ=1。(5.22)式是不完全秩评定的Kendall协同系数运用的一个假设,称作平衡假设。m、n、k之间不是能够完全任意的。如对于4个观察对象的一个配对比较,n=4,m=2,当λ=l时,要求k=6;若λ=2,则k=12,也就是说,当有4名参赛歌手比赛时,按不完全秩评定的设计,从中评出2名给予等级,那么一次比较时,需要6名裁判员,若两次被比较,则需要12名裁判员。一般情况下,λ、m、n、k的取值如表5—17。
表5-17 λ、m、n、k的取值表
| λ | k | n | m |
| 1 | 3 | 3 | 2 |
| 1 | 6 | 4 | 2 |
| 1 | 7 | 7 | 3 |
| 1 | 10 | 5 | 2 |
| 2 | 4 | 4 | 3 |
| 2 | 6 | 3 | 2 |
| 2 | 12 | 4 | 2 |
若每列的实际秩和记作Rj(j=1,2,…,n)那么,实际秩和与平均秩和的差值大小也可以用作判定协调性程度。由于实际秩和与平均秩和之差可正可负,因而,仍采用差值平方和。定义S为
当k组秩的评定完全一致时,S就是
这也就是实际秩和与平均秩和差值平方和的最大可能值。因此,将(5.23)式与(5.24)式相比,可以用来度量k组秩评定之间的协调性或一致性。这就是不完全秩评定的Kendall协同系数,也记作S。其计算公式如(5.25)式和(5.26)式。
如果m=m和λ=k,那么(5.25)式和(5.26)式就是(5.18)式。
W值在0到1之间。W为0,表明k组秩评定之间不相关;W为1,表明k组秩评定之间完全相关,即完全一致。由于k>2时,秩评定的一致和非一致不是对称的,因而,W取值不可能负。为实际计算的方便,(5.25)式和(5.26)式可以写成(5.27)式的形式。
2.应用
【例5-10】消费者对彩电质量评价的一致性分析
7种不同牌号的彩电质量检验,不要求消费者对每一种牌号的彩电都给出秩,只要求不大于3个。因而,m=3,n=7。如果每对彩电仅一次被比较,因而有λ=1。需要的消费者数目,可以从(5—21)式中计算得到
表5-18 消费者对彩电质量可能的评秩
| 消费者编号 | 彩电A | 彩电B | 彩电C | 彩电D | 彩电E | 彩电F | 彩电G |
| 1 | * | * | * | ||||
| 2 | * | * | * | ||||
| 3 | * | * | * | ||||
| 4 | * | * | * | ||||
| 5 | * | * | * | ||||
| 6 | * | * | * | ||||
| 7 | * | * | * |
| 消费者编号 | 彩电A | 彩电B | 彩电C | 彩电D | 彩电E | 彩电F | 彩电G |
| 1 | 1 | 2 | 3 | ||||
| 2 | 1 | 3 | 2 | ||||
| 3 | 3 | 2 | 1 | ||||
| 4 | 2 | 3 | 1 | ||||
| 5 | 1 | 3 | 2 | ||||
| 6 | 2 | 1 | 3 | ||||
| 7 | 1 | 3 | 2 | ||||
| 合 计 | 3 | 5 | 9 | 7 | 8 | 4 | 6 |
分析:由于这是不完全的秩评定,设计要求符合(5—21)式的平衡假定,可以采用不完全秩评定的Kendall协同系数,分析消费者对彩电质量评价的一致性。
根据(5.27)式有
这是W的最大值,表明7个消费者对彩电质量的看法完全一致。
在不完全的秩评定中,同分也是可能出现的,因为数据可以由定距尺度的评分转换为定序尺度的秩。但是,目前没有比较简单的校正公式,因此,计算Kendall协同系数时,仍旧采用(5—24)式,(5—25)式或(5.27)式。
3.显著性检验
对于不完全秩评定的Kendall协同系数,也可以进行显著性检验。建立的假设组为
H0:不相关
H1:存在相关
为对假设作出判定,需要k个样本的数据至少是定序尺度测量的,并能够根据前面的公式分别计算出S、W。利用S、W按照(5.28)式、(5.29)式计算得到检验统计量Q。统计量Q近以于自由度df=n—l的卡方分布。因此,可以根据卡方分布对原假设作出相应的判断。
【例5-11】利用例5-10的数据作显著性检验
分析:在例5-10中,λ=1,m=3,n=7,W=1,将各个数值代入(5.28)式得到
自由度df=n一1=6,在卡方分布表中,H0为真时,Q是12出现的概率P略大于0.05,因为当概率为0.05时,=12.59。由于这个P是近似的值,因而,可以在显著性水平上拒绝H0。况且,W的值为最大可能值l,拒绝H0是合乎逻辑的。
【本章思考题】
1.什么是协同?
2.Spearman等级(秩)相关系数是如何构造的?
3.Kendall协同系数如何计算?
4.OLS估计,Theil回归和最小中位数二乘回归有何区别?
