在定量分析化学实验教学中,实验结束后,必须对分析数据进行处理,这样能拓宽分析化学实验的应用面,以适应厂矿化验室实际工作的需要同时也增强学生分析化学的理论和实验的必备素质。但在一组分析数据中,往往有个别数据与其它数据相差较大,这种个别数据称为可疑值。对可疑值的处理,应首先回顾和检查生产可疑值的实验过程,有无可觉察到的技术上的异常原因当原因不明时,必须按一定的数理统计方法进行处理,决定是保留还是舍弃。统计学处理的方法有许多种,常用的有四倍法、Q检验法、狄克逊(Dixon)检验法和格鲁布斯(Gmbbs)检验法等。
徐中秀曾比较了各种检验方法对可疑值的取舍所作的判断,各进行了一万次模拟试验,认为格鲁布斯检验法效果最好川。
格鲁布斯检验法的优点是在判断可疑值取舍的过程中,将正态分布中的两个最重要的参数— 平均值和标准偏差引进来,故方法的准确性较高。其不足之处是用笔算计算标准偏差稍嫌麻烦,但目前一般计算器大多有计算平均值和标准偏差的功能键,所以使用格鲁布斯检验法也就不感困难了,然而在应用格鲁布斯检验法判断可疑值取舍的过程中,发现在置信水平相同时,在不同文献中有两种临界值表[(2)(3),我们在判断可疑值的取舍时应如何选用呢?
在实际使用中有这样的例子:用重铬酸钾作基准试剂,对硫代硫酸钠溶液的浓度进行标定,共做了六次,测得其物质的量浓度c(Na2S2O3)为0.1025;0.1031;0.1028;0.1051;0.1021mo1/L。用格鲁布斯检验法判断可疑值0.1051是否应舍弃。
通常我们首先算得平均值x = 0. 10315, s=0.00105(均保留一位安全数字)。然后再计算
︱X疑—X平︱ 0.1051一0.10315
G=—————— = ———————— =1.86
S 0.00105
这里要提出的是:一般有效数字修约规则为“四舍六人五留双”。但对标准偏差、格鲁布斯检验统计量等值按“只进不退”的修约规则。 通常把置信水平定为95%。
查阅文献「2〕格鲁布斯检验法的临界值表1, GO..95,6=1.82 G(1.86)>GO. 95,6( 1.82) 所以0.1051为异常值,应舍弃。
但查阅文献〔3]格鲁布斯检验法的临界值表2, GO.95,6=1. G(1.86) 要弄清上述问题,首先我们应了解双尾检验和单尾检验这两个概念。所谓双尾检验是指只要 可疑值和标准值有显著差别,不论高于还是低于标准值,都应判断为异常值。即可疑值可以是最大值,也可以是最小值,否定域处在正态分布的两侧,而单尾检验是指可疑值和标准值有显著差别只高于(或只低于)标准值,都应判为异常值。其否定域集中在正态分布的一头,如空白试验的可疑值只可能为比零稍大的一个数值(s)0 经比较可知文献【2],仁5〕的临界值表为单尾检验的临界值,文献〔1],[3」的临界值表为双尾检验的临界值。从实验内容来看,上例中的可疑值判断属双尾检验。故应选用双尾检验临界值。即查文献「1],[3」中所载的临界值表。 60.95,6(双尾)二1.03〕或60.05,6(双尾)=1.(')。由于G (1.86) < G0.95,6( 1.)故0.1051是正常值,应保留。 由单尾检验和双尾检验的性质不难看出,由于单尾检验的否定域集中在一头,而双尾检验的否定域处于两侧,若把显著性水平确定为a=0.05,本例是双尾检验,如使用文献〔5」的单尾检验的临界值表,G.6=60.025,6(单尾)=1.(5), 同样可以得到正确的结论,但是在文献【2〕的单检验的临界值表则查不到该值,因此不如直接双尾检验的临界值表。 为便于选用,今将格鲁布斯检验法单尾检和双尾检验的临界值表分别摘录于表1与表2.