
3.1节R语言实现
本节所使用的R语言函数为Chisq.test(),该函数的使用格式为:chisq.test(x, y = NULL, correct = TRUE,p = rep(1/length(x), length(x)),
rescale.p = FALSE, simulate.p.value = FALSE, B = 2000)
其中x是由观测数据构成的向量或矩阵,y是数据向量(当x为矩阵时,y无效)。correct是逻辑变量,表明是否用于连续修正,TRUE(缺省值)表示修正,FALSE 表示不修正。P是原假设落在小区间的理论概率,缺省值表示均匀分布。rescale.p是逻辑变量,选择FALSE(缺省值)时,要求输入的p满足求和结果为1;选择TRUE时,并不要求这一点,程序将重新计算p值。simulate.p.value 是逻辑变量(缺省值为FALSE),为TRUE时,将用仿真的方法计算P-值,B表示仿真的次数。
具体案例:
多总体比例差异检验:根据案例,已知列联表为:
R语言代码实现为:
x<-matrix(c(69,56,120,80,123,52),2,3) #生成2行3列的矩阵x
chisq.test(x)
程序及结果截图如下:
3.2节案例R语言实现
多总体比例差异检验:根据案例,已知列联表为:
R语言实现为:
d<-matrix(c(51,56,39,21,8),3,2) #生成3行2列的矩阵d
chisq.test(d)
程序及结果截图如下:
3.3 节案例R语言实现
本节需要用到nortest正态性检验包中的pearson.test()函数,其使用格式为:
pearson.test(x, n.classes = ceiling(2 * (n^(2/5))), adjust = TRUE)
其中,x表示一个向量,允许出现缺失值。n.classes表示变量数量数量,其默认值参考Moore(1986)。adjust为一逻辑变量; 如果为TRUE(默认值),则p 值由具有n.classes-3自由度的卡方分布计算,否则从具有n.classes-1自由度的卡方分布计算。一般而言,后两个参数取默认值即可。
案例:某家公司随机抽取市场营销部的30名销售员,得到他们的月销售额数据(单位:万元):
33 43 44 45 52 52 56 58 63 65 66 68 70 72 73 73 74 75
83 84 85 86 91 92 94 98 102 105
R语言实现为:
library(nortest) #使用nortest正态性检验包
x2<-c(33,43,44,45,52,52,56,58,63,,,65,66,68,70,72,73,73,
74,75,83,84,85,86,91,92,94,98,102,105)
pearson.test(x2)
程序及结果截图如下:
另外,还可以采用Q-Q图方式进行正态分布检验,R语言实现为:qqnorm(x,pch=20) #绘制正态Q-Q图,散点设置为类型“20”的实心点qqline(x,col="red
