惠顿研究
惠顿数据文件在各种结构方程模型中被当作经典案例,包括AMOS和LISREL。本文以惠顿的社会疏离感追踪研究为例详细解释AMOS的输出结果。AMOS同样能处理与时间有关的自相关回归。
惠顿研究涉及三个潜变量,每个潜变量由两个观测变量确定。67疏离感由67无力感(在1967年无力感量表上的得分)和67无价值感(在1967年无价值感量表上的得分)确定。71疏离感的处理方式相同,使用1971年对应的两个量表的得分。第三个潜变量,SES(社会经济地位)是由教育(上学年数)和SEI (邓肯的社会经济指数)确定。
解读步骤
1.导入数据。
AMOS在文件ex06-a.amw中提供惠顿数据文件。使用File/Open,选择这个文件。在图形模式中,文件显示如下。虽然这里是预定义模式,图形模式允许你给变量添加椭圆,方形,箭头等元素建立新模型
2.模型识别。
潜变量的方差和与它关联的回归系数取决于变量的测量单位,但刚开始谁知道呢。比如说要估计误差的回归系数同时也估计误差的方差,就好像说“我买了10块钱的黄瓜,然后你就推测有几根黄瓜,每根黄瓜多少钱”,这是不可能实现的,因为没有足够的信息。如何告诉你“我买了10块钱的黄瓜,有5根”,你便可以推出每根黄瓜2块钱。对潜变量,必须给它们指定一个数值,要么是与潜变量有关的回归系数,要么是它的方差。对误差项的处理也是一样。一旦做完这些处理,其它系数在模型中就可以被估计。 在这里我们把与误差项关联的路径设为1,再从潜变量指向观测变量的路径中选一条把它设为1。这样就给每个潜变量设置了测量尺度,如果没有这个测量尺度,模型是不确定的。有了这些约束,模型就可以识别了。
注释:设置的数值可以是1,也可以是其它数,这些数对回归系数没有影响,但对误差有影响,在标准化的情况下,误差项的路径系数平方等于它的测量方差。
3.解释模型。
模型设置完毕后,在图形模式中点击工具栏中计算估计按钮 运行分析。点击浏览文本按钮 。输出如下。蓝色字体用于注解,不是AMOS输出的一部分。
Title
Example 6, Model A: Exploratory analysis Stability of alienation, mediated by ses. Correlations, standard deviations and means from Wheaton et al. (1977).
以上是标题,全是英文,自己翻译去吧,没有什么价值,一堆垃圾。
Notes for Group (Group number 1)
The model is recursive.
Sample size = 932
各组注释:Group number 1是模型内定的模型名称,因为你还没有给模型取名。它告诉你模型为递归模型,样本量为932。
Variable Summary (Group number 1)
Your model contains the following variables (Group number 1)
Observed, endogenous variables
anomia67
powles67
anomia71
powles71
educatio
SEI
Unobserved, endogenous variables
71_alienation
67_alienation
Unobserved, exogenous variables
eps1
eps2
eps3
eps4
ses
delta1
zeta1
zeta2
delta2
变量汇总:对模型中的变量作一些概括,内生观测变量:67无力感,67无价值感,71无力感,71无价值感,教育和SEI。内生非观测变量:67疏离感,71疏离感。外生非观测变量:各种误差和社会经济地位。
注释:观测变量与非观测变量的区别:一个用方形表示,一个用椭圆表示。内生和外生的区别:箭头指向自己的就是内生,发送箭头的就是外生。注意区分测量模式和结构模式。
Variable counts (Group number 1)
Number of variables in your model: | 17 |
Number of observed variables: | 6 |
Number of unobserved variables: | 11 |
Number of exogenous variables: | 9 |
Number of endogenous variables: | 8 |
Parameter summary (Group number 1)
Weights | Covariances | Variances | Means | Intercepts | Total | |
Fixed | 11 | 0 | 0 | 0 | 0 | 11 |
Labeled | 0 | 0 | 0 | 0 | 0 | 0 |
Unlabeled | 6 | 0 | 9 | 0 | 0 | 15 |
Total | 17 | 0 | 9 | 0 | 0 | 26 |
Computation of degrees of freedom (Default model)
Number of distinct sample moments: | 21 |
Number of distinct parameters to be estimated: | 15 |
Degrees of freedom (21 - 15): | 6 |
(内定模型)迭代过程:极大似然估计是一个迭代过程。这里给出迭代历史。这个输出是可选的,你不必直接使用它。 基本上没有什么用。
Result (Default model)
Minimum was achieved
Chi-square = 71.544
Degrees of freedom = 6
Probability level = .000
卡方拟合指数:这是所有软件都使用的最普通的拟和检验。AMOS 和 LISREL 把它称为卡方统计量,其它软件称为卡方拟和优度 和 卡方拟和劣度 。卡方拟合指数检验选定的模型协方差矩阵与观察数据协方差矩阵相匹配的假设。原假设是模型协方差阵等于样本协方差阵。如果模型拟合的好,卡方值应该不显著。在这种情况下,数据拟和不好的模型被拒绝。卡方检验的问题是样本越大,越可能拒绝模型,越可能犯第一类错误。卡方拟和指数对违反多变量正态假设也是非常敏感。
这由卡方拟和指数的计算公式可以看出:
卡方统计量 = (N-1) x F
N 是样本量,F 是模型协方差阵和样本协方差阵的最小适配函数。这个函数比较复杂,也不知道是哪个天才搞出来的,它的计算公式中包含行列式,矩阵的迹,还要取对数,再经过一些加减运算把数据压缩为一个数值。
从卡方统计量的计算中可以看出,如果适配函数减少的速度没有样本量增加的速度快,即使模型协方差阵与样本协方差阵拟和的很好,但样本量的增加也会导致拒绝原假设。这种拒绝正确建议的行为就是犯了第一类错误。
如果不服从正态分布,卡方统计量会更多地拒绝真实模型。不过好在ML估计比较稳健,所以即使违背了正态分布的假定,模型也能对付着用。
Maximum Likelihood Estimates
SEM使用最大似然法估计模型,而不是通常的最小二乘法。OLS 寻找数据点到回归线距离的最小平方和。MLE寻找最大的对数似然,它反映从自变量观测值预测因变量观测值的可能性有多大。
Regression Weights: (Group number 1 - Default model)
Estimate | S.E. | C.R. | P | Label | |||
67_alienation | <--- | ses | -.614 | .056 | -10.912 | *** | par_6 |
71_alienation | <--- | 67_alienation | .705 | .053 | 13.200 | *** | par_4 |
71_alienation | <--- | ses | -.174 | .054 | -3.213 | .001 | par_5 |
powles71 | <--- | 71_alienation | .849 | .042 | 20.427 | *** | par_1 |
anomia71 | <--- | 71_alienation | 1.000 | ||||
powles67 | <--- | 67_alienation | .888 | .043 | 20.577 | *** | par_2 |
anomia67 | <--- | 67_alienation | 1.000 | ||||
educatio | <--- | ses | 1.000 | ||||
SEI | <--- | ses | 5.331 | .431 | 12.370 | *** | par_3 |
Variances: (Group number 1 - Default model)
Estimate | S.E. | C.R. | P | Label | |
ses | 6.656 | .1 | 10.379 | *** | par_7 |
zeta1 | 5.301 | .483 | 10.967 | *** | par_8 |
zeta2 | 3.737 | .388 | 9.623 | *** | par_9 |
eps1 | 4.010 | .358 | 11.186 | *** | par_10 |
eps2 | 3.187 | .284 | 11.242 | *** | par_11 |
eps3 | 3.696 | .391 | 9.443 | *** | par_12 |
eps4 | 3.622 | .304 | 11.915 | *** | par_13 |
delta1 | 2.944 | .501 | 5.882 | *** | par_14 |
delta2 | 260.630 | 18.256 | 14.277 | *** | par_15 |
用表格看数据总是让人眼花缭乱,还是看图示舒服些,这是上面表格数字的图形显示。
Modification Indices (Group number 1 - Default model)
Covariances: (Group number 1 - Default model)
M.I. | Par Change | |||
eps2 | <--> | delta1 | 5.905 | -.424 |
eps2 | <--> | eps4 | 26.545 | .825 |
eps2 | <--> | eps3 | 32.071 | -.988 |
eps1 | <--> | delta1 | 4.609 | .421 |
eps1 | <--> | eps4 | 35.367 | -1.069 |
eps1 | <--> | eps3 | 40.911 | 1.253 |
M.I. | Par Change |
M.I. | Par Change | |||
powles71 | <--- | powles67 | 5.457 | .057 |
powles71 | <--- | anomia67 | 9.006 | -.065 |
anomia71 | <--- | powles67 | 6.775 | -.069 |
anomia71 | <--- | anomia67 | 10.352 | .076 |
powles67 | <--- | powles71 | 5.612 | .054 |
powles67 | <--- | anomia71 | 7.278 | -.054 |
anomia67 | <--- | powles71 | 7.706 | -.070 |
anomia67 | <--- | anomia71 | 9.065 | .068 |
对协方差的修正指数,如果两个误差项变量允许相关,MI与卡方统计量减少有关。对估计回归系数的修正指数,如果去掉两个变量间的路径,在模型中不再要求估计去掉路径的系数,MI与卡方统计量的减少有关。常用的方法是去掉最大MI的参数,通过卡方拟合指数看看测量效果。自然地,去掉路径或允许误差项变量相关只有当它有实际意义并且统计感觉也是这样时才能执行。LISREL和AMOS都计算修正指数。
既然这样, 最大的 MI 是 40.911 ,位于eps1 (67无力感误差项) 和eps3 (71无力感误差项) 间。建议去掉两个误差项相关系数为 0 的约束,即,允许相关将使卡方统计量的估计至少减少40.911。惠顿数据是纵向数据,在时间序列中,两个不同时间点(1967和1971)相同测量(无力感)的自相关很相似,所以去掉这个约束在理论上有一个合理的理由。相同的逻辑用于去掉 eps2 和 eps4 (分别为1967和1971无价值感的误差变量)间零相关的约束, 它使卡方统计量的估计减少26.545。
然而,在这个输出中,我们没有用这种方式重新设置模型。要看见改变设置的效果,见AMOS自带文件 ex06-b.amw。
Model Fit Summary
CMIN
Model | NPAR | CMIN | DF | P | CMIN/DF |
Default model | 15 | 71.544 | 6 | .000 | 11.924 |
Saturated model | 21 | .000 | 0 | ||
Independence model | 6 | 2131.790 | 15 | .000 | 142.119 |
NPAR 是模型中被估计的参数个数,不是拟合测量。
P(CMIN) 处理最小样本差异 。如果 P(CMIN) 小于 0.05,我们拒绝数据完全拟合模型的原假设。对大样本,原假设非常可能被拒绝。按照这个标准,这个模型作为完整拟合被拒绝。
CMIN/DF 是最小样本差异除以自由度。被称之为相对卡方或规范卡方。有些人允许这个值达到5作为适当的拟合,但是当相对卡方大于2或3时,保守的使用就需要拒绝模型。按照此标准,这个模型应被拒绝。
RMR, GFI
Model | RMR | GFI | AGFI | PGFI |
Default model | .284 | .975 | .913 | .279 |
Saturated model | .000 | 1.000 | ||
Independence model | 12.342 | .494 | .292 | .353 |
GFI 是拟合优度指数,范围在0和1间,但理论上能产生没有意义的负数。按照约定,要接受模型,GFI 应该等于或大于0.90。按照此标准,这个模型可接受。
AGFI 是调整拟合优度指数,利用自由度和变量个数的比例来调整GFI,它的变化范围也是0和1间,但理论上能产生没有意义的负数。AGFI 也应该至少大于0 .90。按照此标准,这个模型可接受。
PGFI 是简效拟合优度指数。它是模式的自由度与内定模式的自由度的比率乘以GFI。
Baseline Comparisons
Model | NFI Delta1 | RFI rho1 | IFI Delta2 | TLI rho2 | CFI |
Default model | .966 | .916 | .969 | .923 | .969 |
Saturated model | 1.000 | 1.000 | 1.000 | ||
Independence model | .000 | .000 | .000 | .000 | .000 |
NFI 是规范拟合指数,变化范围在0和1间, 1 = 完全拟合。按照约定,NFI 小于0.90 表示需要重新设置模型。
RFI 是相对拟合指数,它不保证其值的变化范围在0和1间。RFI 接近1表示拟合良好。
IFI 是增值拟合指数,它不保证其值的变化范围在0和1间。IFI接近1表示拟合良好,大于0.90为可接受拟合。
TLI 是Tucker-Lewis 系数,也叫做Bentler-Bonett 非规范拟合指数 (NNFI)。TLI不保证其值的变化范围在0和1间。TLI接近1表示拟合良好。
CFI 是比较拟合指数,其值位于0和1之间。CFI 接近1表示拟合非常好,其值大于0.90表示模型可接受。
Parsimony-Adjusted Measures
Model | PRATIO | PNFI | PCFI |
Default model | .400 | .387 | .388 |
Saturated model | .000 | .000 | .000 |
Independence model | 1.000 | .000 | .000 |
PNFI 是简效规范拟合指数,等于PRATIO 乘以 NFI。
PCFI 是简效比较拟合指数,等于PRATIO 乘以 CFI。
NCP
Model | NCP | LO 90 | HI 90 |
Default model | 65.544 | 41.936 | 96.603 |
Saturated model | .000 | .000 | .000 |
Independence model | 2116.790 | 1968.786 | 2272.133 |
Model | FMIN | F0 | LO 90 | HI 90 |
Default model | .077 | .070 | .045 | .104 |
Saturated model | .000 | .000 | .000 | .000 |
Independence model | 2.290 | 2.274 | 2.115 | 2.441 |
Model | RMSEA | LO 90 | HI 90 | PCLOSE |
Default model | .108 | .087 | .132 | .000 |
Independence model | .3 | .375 | .403 | .000 |
AIC
Model | AIC | BCC | BIC | CAIC |
Default model | 101.544 | 101.771 | 174.104 | 1.104 |
Saturated model | 42.000 | 42.318 | 143.584 | 1.584 |
Independence model | 2143.790 | 2143.881 | 2172.814 | 2178.814 |
Model | ECVI | LO 90 | HI 90 | MECVI |
Default model | .109 | .084 | .142 | .109 |
Saturated model | .045 | .045 | .045 | .045 |
Independence model | 2.303 | 2.144 | 2.470 | 2.303 |
AIC 是赤池信息准则。
BCC 是Browne-Cudeck 准则。
BIC 是贝耶斯信息准则,也是知名的赤池贝耶斯信息准则(ABIC)。
CAIC 是一致 AIC 准则。
ECVI 是AIC 的另一种变体。
MECVI 是BCC的变体。
HOELTER
Model | HOELTER .05 | HOELTER .01 |
Default model | 1 | 219 |
Independence model | 11 | 14 |
Execution time summary
Minimization: | .090 |
Miscellaneous: | 1.312 |
Bootstrap: | .000 |
Total: | 1.402 |