7.1引言
与以往依据经验推导出理论知识的研究范式不同,实证研究强调理论知识的可靠性必须建立在观察和实验的经验证明的基础之上。实证研究通过经验观察的数据和实验研究的手段来证明理论假设,就必须要求这种假设具有可证性。实证研究方法不仅在自然科学领域得到广泛应用,而且已对社会科学的研究产生深刻影响,提升了社会现象的研究的精确性和科学性。实证研究的过程一般包括如下几个步骤:
(1)问题确定
研究问题或是来源于研究者在实践中遇到的新问题或是在已有理论基础上的拓展,前一类问题研究往往有很强的创新性,但由于缺乏相关研究支撑,难度可能也较大,后一类类问题难度往往较小,但创新程度也可能不大。研究者往往需要在这两个方面进行平衡。
(2)文献研究
文献研究有助于研究者熟悉所研究领域,对研究问题的价值进行评估,并寻找到真正的问题所在,同时有助于避免无意义的重复研究。
(3)提出理论框架和假设
理论框架主要包括变量、变量间关系和系统图,如路径分析和结构方程模型中的变量间关系的路径图。假设则是指将变量间关系的合理推测以可验证的命题表达出来。
(4)样本选择及数据采集
样本的选择根据问题的差异而定,样本的数据或部分数据可以从公开的数据中获得如年鉴、报刊、上市公司年报等,也可以通过问卷调查的方式获得。
(5)数据分析及假设检验
数据分析一般结合各种统计软件进行,根据数据分析的结果可以确定测量模型是否合理以及总体模型的拟合情况,根据这些结果就可以进一步地确定能否对假设进行验证。
本章主要介绍实证研究方法中的结构方程模型方法,并按照结构方程模型的思想来源分别介绍因子分析(包括探索性因子分析和验证性因子分析)、路径分析等探索性和实证性的方法,接着重点介绍结构方程模型,最后应用结构方程模型软件Amos7.0对验证性因子分析、路径分析和结构方程模型加以应用举例,注重通过对不同方法之间关系的比较使研究者逐步加深对结构方程模型方法和技术的理解和掌握。
结构方程模型(Structural Equation Modeling, 简称SEM)是一种融合了因子分析和路径分析的多变量统计方法和技术,是第二代数据分析方法和技术,能够进行高质量的数据分析。与第一代数据处理技术如回归分析相比,结构方程模型能够对多个自变量和多个因变量的关系进行建模并通过简单而系统的分析同时解决一系列相关研究问题,同时,可以通过多个可直接观测变量来衡量无法直接观测的潜在变量,减少了变量的测量误差,根本上提高研究的精度。
因此,结构方程模型方法的问世极大便利了理论研究的验证。自上世纪80年代以来,随着电脑科技的发展,该技术日益成熟,成为多变量数据分析的重要工具,日益受到研究者的青睐。目前,已经有多种软件可以处理SEM,包括:LISREL,AMOS, EQS, Mplus等。
7.2因子分析
因子分析(Factor Analysis)起源于心理学,该领域的诸多变量如智力、动机、能力、兴趣等的无法直接测量,需要通过外显行为来测量,因子分析就是寻找许多可直接观测的指标或变量背后的不可直接观测的解释因子。因子分析的思想是结构方程模型分析的重要组成部分,该思想的出现增加了难以直接观测的潜在变量衡量的精确性,减少了测量误差,使得变量间因果关系模型的研究更为接近事实。按照用途和处理方法的不同,因子分析可分为探索性因子分析和验证性因子分析。
7.2.1探索性因子分析
1.探索性因子分析(EFA)和主成分分析(PCA)
探索性因子分析(Exploratory Factor Analysis)和主成分分析(Principal Components Analysis)都是探索性的技术,是多变量统计中降低变量维度的方法,理清两者之间的关系有助于加深对因子分析的理解。探索性因子分析和主成分分析的共同点在于通过找出不可直接观察的因子,对具有高度相关性的变量作精简,都是为了将变量进行归类。但在使用目的和数据处理上两者仍然存在着差别,探索性因子分析假设在实际的观测变量之下,存在着少数没有被观察到的潜在变量或构念,而主成分分析试图用数学方法推导出少数变量来传达尽可能多的信息。
代表主成分,代表变量或测量指标
图7.1 主成分分析
代表因子,代表变量或测量指标
图7.2 探索性因子分析
两种测量方法的差异如图7.1和图7.2所示。方框代表可直接观测的变量或指标,圆框代表主成分或因子,箭头代表因果关系。从图中可以看出,主成分分析中的主成分是所有变量的线性函数,并且不允许变量有测量误差;相反,因子分析是将变量区分为共同因子和测量误差两部分,变量是不可观察因子的线性函数。
2.探索性因子分析过程
为便于研究者深入理解并掌握探索性因子分析方法,我们首先给出探索性因子分析的步骤和流程图,接着结合SPSS软件分析通过案例分析具体介绍这一方法。探索性因子分析一般包括如下步骤:选取变量,并将其标准化;分析变量间的相关系数矩阵;求解公共因子及因子负荷矩阵;通过因子旋转得出因子得分;结果分析。其分析流程如图7.3所示。
图7.3 探索性因子分析流程图
例7.1 由于主成分分析在前面已有介绍,在此,我们仅介绍探索性因子分析的软件分析步骤和结果解释。我们基于2006年49家上市公司部分指标进行探索性因子分析,样本及指标见表7.1。我们相信,在这些指标中可能会存在3个反映上市公司经营情况的潜在结构,大体上应该有收益、收益增长和负债等三个方面,据此我们通过探索性因子分析看看这些指标能否结合到这三个方面。
表7.1 样本数据
公司简称 | 主营业 务收入 | 净利润 | 净利润率 | 净资产增长率 | 总资产增长率 | 营业利润增长率 | 每股收益 | 流动 资产 | 财务 费用 | 现金负债比率 | 现金流负债比 | 债务资产比率 |
万科A | 1.78E+10 | 2154639315 | 0.12 | 0.79 | 1.21 | 0.69 | 0.49 | 4.47E+10 | 1.4E+08 | 0.56 | 0.81 | 0. |
国农 | 456398 | 619804.46 | 0.01 | 0.01 | 0.31 | -1.2 | 0.01 | 1.5E+08 | 774295 | 0.49 | 0.50 | 0.45 |
深振业 | 1.25E+09 | 216253765 | 0.17 | 0.15 | 0.14 | 2.12 | 0.85 | 1.65E+09 | 24453738 | 0.78 | 0.90 | 0.54 |
深达声 | 1.94E+08 | -91523394 | -0.47 | -1.11 | -0.06 | -5.69 | -0.49 | 2.95E+08 | 376357 | 0.24 | 0.24 | 0.97 |
宝利来 | 10356391 | -1756059 | -0.16 | 0.05 | -0.15 | -0.56 | -0.02 | 38218721 | -76015 | 1.95 | 1.95 | 0.06 |
深宝安 | 2.49E+09 | 100265051 | 0.04 | 0.16 | 0.13 | 0.25 | 0.10 | 4.16E+09 | 1.17E+08 | 0.69 | 0.86 | 0. |
华新 | 98638149 | 7204444 | 0.07 | 0.09 | -0.31 | -0.55 | 0.04 | 1.73E+08 | 7628125 | 0.62 | 0.62 | 0. |
深物业 | 3.12E+08 | -46054221 | -0.14 | -0.10 | -0.08 | -1.29 | -0.08 | 1.24E+09 | 15268771 | 0.29 | 0.35 | 0. |
南玻A | 2.95E+09 | 332111553 | 0.11 | 0.06 | 0.23 | 0.07 | 0.32 | 1.29E+09 | 87982201 | 0.77 | 0.96 | 0.56 |
沙河股份 | 3.35E+08 | 31022151 | 0.09 | 0.08 | 0.03 | -0.08 | 0.23 | 9.34E+08 | 6851109 | 0.51 | 0.66 | 0.63 |
深康佳 | 1.27E+10 | 102638435 | 0.01 | 0.02 | 0.09 | 2.61 | 0.17 | 8.52E+09 | 13844699 | 1.97 | 1.98 | 0. |
中华 | 2.2E+08 | -98015 | -0.04 | 0.02 | -0.19 | -0.24 | -0.02 | 81858008 | -1.4E+07 | 0.10 | 0.10 | 7.97 |
深中冠 | 2.41E+08 | 30057907 | 0.12 | 0.08 | -0.10 | 0.25 | 0.17 | 2.4E+08 | 9814511 | 1.66 | 1.83 | 0.32 |
深深宝 | 1.02E+08 | 39059405 | 0.38 | 0.16 | 0.07 | 0.12 | 0.21 | 2.07E+08 | 2876537 | 0.59 | 0.59 | 0.36 |
华发A | 1.61E+08 | -19554248 | -0.12 | -0.06 | -0.03 | -4.11 | -0.06 | 1.39E+08 | 5203253 | 1.05 | 1.05 | 0.40 |
长城开发 | 1.03E+10 | 341185208 | 0.03 | 0.08 | -0.07 | -0.08 | 0.38 | 2.74E+09 | 75597 | 11.7 | 11.8 | 0.22 |
深赤湾 | 1.91E+09 | 6139828 | 0.32 | 0.06 | 0.00 | -0.02 | 0.95 | 4.41E+08 | 51050121 | 1.24 | 1.46 | 0.33 |
深天地 | 6.63E+08 | 324842 | 0.04 | 0.13 | -0.05 | -2.50 | 0.23 | 5.02E+08 | 9840187 | 1.07 | 1.09 | 0.69 |
招商地产 | 2.94E+09 | 567912385 | 0.19 | 0.14 | 0.59 | 0.31 | 0.91 | 1.09E+10 | -7902914 | 0.30 | 0.51 | 0.68 |
特力A | 1.13E+09 | -92148791 | -0.08 | -0.40 | -0.03 | -4.50 | -0.41 | 2.92E+08 | 115245 | 1.76 | 1.78 | 0.77 |
飞亚达 | 4.87E+08 | 29263221 | 0.06 | 0.05 | 0.24 | 0.73 | 0.11 | 4.85E+08 | 5684509 | 2.41 | 2.51 | 0.26 |
深能源 | 6.95E+09 | 800110239 | 0.11 | 0.04 | 0.02 | -0.04 | 0.66 | 4.75E+09 | 72520665 | 2.27 | 6.74 | 0.27 |
一致药业 | 5.67E+09 | 72555229 | 0.01 | 0.13 | 1.49 | 1.47 | 0.25 | 2.11E+09 | 21028176 | 2.56 | 2.72 | 0.82 |
深深房 | 9.91E+08 | 19259485 | 0.01 | 0.03 | 0.05 | -2.69 | 0.01 | 1.96E+09 | 311865 | 0.75 | 0.80 | 0.54 |
盛润 | 0.0001 | 18660262 | -97 | -0.01 | -0.24 | -1.27 | 0.06 | 59784 | 21533570 | -97 | -97 | 55.1 |
中粮地产 | 3.46E+08 | 174428317 | 0.50 | 0.10 | 0.29 | -0.04 | 0.24 | 8.06E+08 | 23773931 | 0.33 | 0.36 | 0.41 |
深桑达 | 1.69E+09 | 41318145 | 0.02 | 0.03 | 0.04 | 0.50 | 0.21 | 1.06E+09 | 9012109 | 2.44 | 2.44 | 0.50 |
新都酒店 | 719872 | -138879856 | -1.81 | -0.31 | -0.16 | -11.5 | -0.42 | 35701068 | 10749218 | 0.37 | 0.87 | 0.40 |
深泰 | 3.42E+08 | 2955737 | 0.01 | 0.12 | -0.29 | -0.49 | 0.01 | 4.15E+08 | 43840201 | 0.35 | 0.37 | 1.76 |
华联控股 | 5.36E+09 | 192908096 | 0.03 | 0.11 | 0.36 | 1.18 | 0.17 | 4.96E+09 | 1.38E+08 | 0.58 | 0.86 | 0.75 |
深南电 | 3.86E+09 | 63466109 | 0.01 | 0.04 | 0.13 | 2.29 | 0.11 | 1.72E+09 | 1.2E+08 | 1.29 | 1.45 | 0.62 |
中集集团 | 3.32E+10 | 2771723086 | 0.08 | 0.17 | 0.33 | -0.08 | 1.24 | 1.51E+10 | 233027 | 3.02 | 3.26 | 0.47 |
鸿基 | 5.72E+08 | 12202259 | 0.02 | 0.01 | 0.06 | -1.91 | 0.02 | 1.17E+09 | 50010382 | 0.44 | 0.69 | 0.56 |
深长城 | 8.31E+08 | 761561 | 0.09 | 0.02 | 0.34 | 0.48 | 0.31 | 2.19E+09 | 57228136 | 0.32 | 0.67 | 0.61 |
深南光 | 1.41E+09 | 69809738 | 0.04 | 0.12 | 0.47 | 0.11 | 0.50 | 1.79E+09 | 13850139 | 0.87 | 1.21 | 0.73 |
泛海建设 | 1.34E+09 | 255261903 | 0.19 | 1.88 | 0.92 | 6.34 | 0.33 | 6.9E+09 | 34128 | 0.35 | 0.54 | 0.51 |
康达尔 | 7.46E+08 | -951811 | -0.12 | -4.30 | -0.20 | -8.35 | -0.24 | 3.59E+08 | 40024997 | 0.74 | 0.75 | 1.14 |
德赛电池 | 8.69E+08 | 20038269 | 0.02 | 0.12 | 0.02 | 0.21 | 0.14 | 4.33E+08 | 7863900 | 2.38 | 2.38 | 0.59 |
深天马 | 1.51E+09 | 93795610 | 0.06 | 0.10 | 0.16 | 0.91 | 0.28 | 8.32E+08 | 36214863 | 2.21 | 2.25 | 0.44 |
方大A | 6.71E+08 | 7986812 | 0.01 | 0.01 | -0.06 | -0.79 | 0.02 | 6.11E+08 | 21687075 | 0.96 | 0.97 | 0.61 |
深国商 | 71030842 | -114798 | -0.16 | -0.18 | 0.02 | 6.92 | -0.05 | 6.14E+08 | 9243038 | 0.12 | 0.13 | 0.78 |
深赛格 | 1.91E+09 | -67169248 | -0.03 | -0.04 | -0.09 | -0.28 | -0.08 | 1.07E+09 | 44462818 | 1.16 | 1.22 | 0.51 |
辽通化工 | 2.48E+09 | 314281 | 0.03 | 0.08 | 0.08 | -0.57 | 0.13 | 7.96E+08 | 1.46E+08 | 0.92 | 1.58 | 0.59 |
中金岭南 | 6.24E+09 | 1134582368 | 0.18 | 1.24 | 0.51 | 2.50 | 1.7 | 4.48E+09 | 1.44E+08 | 1.61 | 2.33 | 0.53 |
农产品 | 1.7E+09 | 50015842 | 0.02 | 0.03 | -0.04 | -0.19 | 0.12 | 1.23E+09 | 50250251 | 0.76 | 1.04 | 0.52 |
深圳华强 | 2.11E+09 | 83546842 | 0.03 | 0.03 | -0.07 | -1.30 | 0.27 | 1.26E+09 | 3266753 | 1.99 | 2.01 | 0.42 |
中兴通讯 | 2.3E+10 | 807353000 | 0.03 | 0.05 | 0.19 | -0.60 | 0.84 | 2.06E+10 | 2.4E+08 | 1.56 | 2.06 | 0.56 |
北方国际 | 1.49E+09 | 18832406 | 0.01 | 0.06 | 0.10 | -0.17 | 0.11 | 1.26E+09 | 12306621 | 1.56 | 1.90 | 0. |
(1)数据输入:将上述数据进行标准化处理并转换为SPSS文件格式(略)。
(2)数据处理:首先,单击Analyze=>Data Reduction=>Factor,打开Factor Analysis对话框,将左边的变量送入Variables对话框。
下一步,单击Descriptives按钮,选择Initial solution, Coefficients, Determinant和KMO and Bartlett’s test of sphericity;单击Continue按钮,然后返回主对话框。
接着,在主对话框中单击Extraction对话框,在Method的下拉菜单中选择Principal axis factoring,即采用主轴因子分析法;选择Correlation matrix和Number of factors,在其框中选择3,即在指标中提取3个因子;然后单击Continue按钮,返回主对话框。
下一步,在主对话框中打开Rotation对话框,选择Varimax和Rotated solution,即采用最大方差和旋转解;然后单击Continue按钮,返回主对话框。
接下来,在主对话框中打开Options对话框,选择Sorted by size和Suppress absolute values less than,在其输入框中输入0.3,以抑制小于0.3的因子负荷,其原因在于因子负荷太小的变量不具解释力,加以抑制也使得输出结果更为清晰易读;然后单击Continue按钮,返回主对话框。
最后,在主对话框中单击OK按钮,输出结果。
(3)结果输出和解释
根据SPSS软件输出结果,指标的相关系数矩阵(correlation matrix)显示了12个指标之间的关系,高的相关性表明两个指标之间很可能通过因子分析归入同一组中,该表下方的Determinant 为2.47E-009,大于0.0001,表明有解(见表7.2)。
表7.2 相关系数矩阵
Correlation | 主营业 务收入 | 净利润 | 净利 润率 | 净资产 增长率 | 总资产 增长率 | 营利 增长率 | 每股 收益 | 流动 资产 | 财务 费用 | 现金债 务比率 | 现金流 负债比 | 债务资 产比率 |
主营业务收入 | 1.000 | |||||||||||
净利润 | .849 | 1.000 | ||||||||||
净利润率 | .081 | .061 | 1.000 | |||||||||
净资产增长率 | .144 | .267 | .011 | 1.000 | ||||||||
总资产增长率 | .337 | .439 | .160 | .394 | 1.000 | |||||||
营业利润增长率 | .144 | .201 | .051 | .602 | .413 | 1.000 | ||||||
每股收益 | .542 | .700 | .070 | .425 | .407 | .450 | 1.000 | |||||
流动资产 | .718 | .763 | .068 | .234 | .549 | .173 | .390 | 1.000 | ||||
财务费用 | .508 | .440 | .054 | .096 | .244 | .126 | .380 | .506 | 1.000 | |||
现金债务比率 | .116 | .072 | .992 | .010 | .146 | .037 | .079 | .0 | .035 | 1.000 | ||
现金流负债比 | .122 | .083 | .991 | .014 | .147 | .037 | .092 | .068 | .047 | .999 | 1.000 | |
债务资产比率 | -.090 | -.068 | -.990 | -.015 | -.171 | -.037 | -.079 | -.073 | -.068 | -.986 | -.985 | 1.000 |
表7.3中KMO测度为0.729,大于0.7,表明析出因子所需的指标数量足够;Bartlett's Test小于0.05,具有显著性,表明指标之间高度相关,能够析出因子。表7.4的共因子方差表明了变量和所有其他变量间的关系。
表7.3 KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. | .729 | |
Bartlett's Test of Sphericity | Approx. Chi-Square | 855.436 |
df | 66 | |
Sig. | .000 |
Communalities | Initial |
主营业务收入 | .829 |
净利润 | .878 |
净利润率 | .992 |
净资产增长率 | .437 |
总资产增长率 | .466 |
营业利润增长率 | .497 |
每股收益 | .692 |
流动资产 | .750 |
财务费用 | .473 |
现金债务比率 | .999 |
现金流动负债比率 | .998 |
债务资产比率 | .983 |
表7.5显示了12个可能因子之间的方差分配情况,其中三个因子的特征值大于1.0,表明三个因子都是可用的,这与我们分析前的预测和在分析过程中设定的因子数一致。当然,也可以根据理论或相关系数矩阵将因子数设定为2个。需要注意的是特征值低于1.0的不予采用,因为这时因子解释的信息低于单个指标。
表7.5 Total Variance Explained
Factor | Initial Eigenvalues | Rotation Sums of Squared Loadings | ||||
Total | % of Variance | Cumulative % | Total | % of Variance | Cumulative % | |
1 | 4.404 | 36.696 | 36.696 | 3.972 | 33.102 | 33.102 |
2 | 3.558 | 29.9 | 66.345 | 3.115 | 25.959 | 59.060 |
3 | 1.550 | 12.914 | 79.259 | 1.697 | 14.145 | 73.205 |
4 | .714 | 5.946 | 85.205 | |||
5 | .653 | 5.439 | 90.4 | |||
6 | .449 | 3.742 | 94.385 | |||
7 | .375 | 3.126 | 97.511 | |||
8 | .1 | 1.577 | 99.0 | |||
9 | .086 | .721 | 99.809 | |||
10 | .016 | .130 | 99.939 | |||
11 | .007 | .054 | 99.993 | |||
12 | .001 | .007 | 100.000 |
表7.6非常重要,该表列出了因子在每个题项中的载荷,当然,根据分析过程的设定该表已经排除了绝对值低于0.3的载荷,研究者可以根据需要设定绝对值,如0.4、0.5等。从表中可以看出,分析结果已经将12个指标按照大小顺序分为三组,其中有部分重叠。当然每个因子在每个指标上事实上都有载荷,只是我们将绝对值设定在0.3,排除了绝对值更低的载荷。由该表可见,Factor1有最高载荷的4项:现金债务比率、净利润率、现金流动负债比率、债务资产比率;Factor2有5项:净利润、主营业务收入、流动资产、每股收益、财务费用;Factor3有3项:营业利润增长率、净资产增长率、总资产增长率。从各因子的指标间关系来看,Factor1、Factor2 和Factor3基本可看成为债务、收益和收益增长等三个方面的的因子。当然,研究者还要根据这些指标的内容,进一步确定其能否合成一个因子。如净利润率与债务方面应该没有相关性,不应将其作为Factor1的指标;Factor2 和Factor3在每股收益上都有较高的载荷,但根据理论每股收益应在收益方面的范围内,并且由于因子分析要求以一个因子预测各个指标,因此应将每股收益作为Factor2指标,同理总资产增长率应作为Factor3的指标。表7.7是用于初始的因子矩阵向旋转因子转换的,并不重要。
表7.6 Rotated Factor Matrixa
Rotated Factor Matrixa | Factor | ||
1 | 2 | 3 | |
现金债务比率 | .996 | ||
净利润率 | .995 | ||
现金流动负债比率 | .995 | ||
债务资产比率 | -.9 | ||
净利润 | .923 | ||
主营业务收入 | .5 | ||
流动资产 | .803 | ||
每股收益 | .560 | .471 | |
财务费用 | .546 | ||
营业利润增长率 | .807 | ||
净资产增长率 | .740 | ||
总资产增长率 | .413 | .456 |
Rotation Method: Varimax with Kaiser Normalization.
a. Rotation converged in 4 iterations.
表7.7 Factor Transformation Matrix
Factor | 1 | 2 | 3 |
1 | .829 | .496 | .259 |
2 | -.560 | .737 | .380 |
3 | -.002 | -.460 | .888 |
Rotation Method: Varimax with Kaiser Normalization.
7.2.2验证性因子分析
1.探索性因子分析(EFA)和验证性因子分析(CFA)
因子分析方法依照其性质的不同,可以区分为探索性因子分析和验证性因子分析(Confirmatory Factor Analysis),结构方程模型中的测量模型应用的就是验证性因子分析的思想,即用指标测量无法直接观察的潜在变量的模型。虽然两种分析方法的数学原理是一致的,但其用途和处理方法存在着差异。在探索性因子分析中,研究者事先并不知道可观测的变量背后有多少个因子,也不知道因子与变量的从属关系,采用这一方法就是要找到潜在的共同因子,以达到降维的目的。研究者一是要根据实际情况分析结果,二是要根据统计的判断准则来决定所要保留的因子数。而在验证性因子分析中,研究者心目中已经有了假设的理论模型,因子的数量以及因子与变量之间的从属关系都非常明确,采用这一方法的目的是分析实际的观测数据与理论模型拟合的程度,以验证理论模型的效度。因此,在探索性因子分析的最终结果中,即使变量并不从属于某一因子,但其因子负荷都有或大或小的值,往往也不为零,如图7.2所示。而在验证性因子分析的最终结果中,每个变量只在其所属的因子上有负荷,而在其他因子上的负荷都为零。两种分析方法的差异见图7.2和图7. 4。
图7.4 验证性因子分析
代表因子,代表变量或测量指标
在验证性因子分析以及结构方程模型的分析中,都不能出现同一个变量从属于不同因子的情况,如图7.2中在与之间建立相关关系在验证性因子分析中都应加以避免。同样变量的误差项应相互,不能出现将误差之间假设为相关的情况,如图7.5所示,假设、具有相关性或假设、具有相关性都应当避免。在验证性因子分析和结构方程模型中,修正指数(modification indices)往往会提醒研究者在哪些误差之间建立连接能够优化模型的拟合指数,但这样做是不符合验证性因子分析的基本原则,研究者还是要通过重新考虑理论假设、分析指标之间的关系、合理选取指标,以及重新确定因子数等来决定模型的修改和优化,这样的话就又回到探索性因子分析。事实上,一个具有解释力的因子结构的获得往往需要经过多次探索性因子分析和验证性因子分析的循环。
代表因子,代表变量或测量指标
图7.5 验证性因子分析
2.验证性因子分析过程
验证性因子分析一般包括如下步骤:建立理论模型;模型识别;参数估计;模型评价和修正;结果分析。其分析流程如图7.6所示,接下来我们结合案例加以详细介绍。
图7.6 路径分析流程图
例7.2为了与探索性因子分析比较的方便,我们根据前面探索性因子分析案例得出的因子分析结果设定假设模型,并另外抽取2006年其他200家上市公司为样本进一步验证结果。由于结构方程模型方法和软件是进行验证性因子分析的有效工具,我们采用结构方程模型软件Amos7.0进行验证性因子分析。
(1)模型构建
打开Amos7.0软件。首先根据上述探索性因子分析结果绘制假设模型,该软件采用直观的绘图方法,便于研究者表现因子和指标之间的关系,如图7.7所示。假设模型有债务、收益和收益增长三个因子,其中债务由3项指标来衡量:现金流动负债比率、债务资产比率(对其取倒数)、现金债务比率;收益有5项:净利润、主营业务收入、财务费用、每股收益、流动资产;收益增长有3项:总资产增长率、净资产增长率、营业利润增长率。
图7.7假设模型
(2)数据输入和分析
点击View=>Analysis Properties对话框,在Estimation的下拉菜单中选择Maximum likelihood,即采用最大似然法进行拟合,在输出命令Output的下拉菜单中选择Standardized estimates,然后关闭该对话框。
下一步点击File按钮,在其下拉菜单中打开Data files对话框,点击File Name确定数据位置,点击View Data查看数据内容,点击OK输入数据,然后退出对话框。
接下来点击Analyze按钮,打开Calculate Estimates,软件将对数据进行拟合。点击View Text按钮查看输出结果。同时也可以在主对话框点击View the output path diagram,得到直观的标准化因子负荷,如图7.8所示。
图7.8标准化因子负荷
(3)模型评价和结果解释
输出结果主要包括了整体模型检验和参数检验两部分。首先我们分析模型的整体拟合情况,见表7.8的拟合指数表,拟合指数的分类、构造和功能参见候杰泰等(2005),本书不做一一说明。模型拟合的卡方和自由度为 2=201.9、df=41, 2/df的拟合数值分别为4.9,一般认为 2/df低于5表示模型可以接受,低于3则表明模型拟合很好,表明该模型可以接受,但拟合的优度不高;绝对拟合指数RMSEA为0.14,一般认为该值应低于0.1模型才可接受,因此该模型不能被接受;其他绝对拟合指数和相对拟合指数如GFI、AGFI、NFI、RFI、IFI、TLI、CFI基本都大于0.8,并接近1.0,表明模型具有较好的拟合效果。综合这三方面的评价,整体模型的拟合优度并不理想。
表7.8因子模型的拟合指数
Model | 2 | df | GFI | AGFI | NFI δ1 | RFI ρ1 | IFI δ2 | TLI ρ2 | CFI | RMSEA |
Default model | 201.9 | 41 | .858 | .772 | .1 | .853 | .911 | .880 | .910 | .140 |
表7.9 标准化因子负荷
标准化因子负荷 | Estimate | p值 |
现金流负债比(X1)<—债务 | .987 | *** |
债务资产比率(X2)<—债务 | .383 | *** |
现金负债比率(X3)<—债务 | 1.002 | |
净利润(X4)<—收益 | .773 | *** |
主营业务收入(X5)<—收益 | .952 | *** |
财务费用(X6)<—收益 | .752 | *** |
每股收益(X7)<—收益 | .477 | *** |
流动资产(X8)<—收益 | .980 | |
总资产增长率(X9)<—收益增长 | 1.276 | |
净资产增长率(X10)<—收益增长 | .239 | .201 |
营业利润增长率(X11)<—收益增长 | .038 | .540 |
7.3路径分析
除验证性因子分析外,路径分析(Path Analysis)的思想是结构方程模型分析另一个重要组成部分。路径分析是由生物学家赖特(Wright,1921)首先提出并发展起来的一种因果模型分析技术,已成为社会学的主要分析方法之一,其目的是验证假设因果模型的准确性和可靠性,并测量变量间的因果关系。在结构方程模型及其统计软件出现之前,路径分析一直是处理变量间多因多果关系的重要方法。路径分析与回归分析的差异在于,回归模型中可以有多个自变量,但因变量只有一个,并且只能分析直接的因果关系,而路径分析可以处理多因多果关系以及一个变量既是自变量又是因变量的中介作用的问题。
例如,在前述探索性因子分析中的几个因子可能有这样的关系,企业的利润水平受到总资产增长率、财务费用以及主营业务收入的影响,同时,主营业务收入又受到总资产和财务费用的影响。根据上述因子分析的内容,这些变量都是显性的可直接观测变量,企业的总资产增长率、财务费用、主营业务收入和利润分别由表示。根据理论假设,这些变量之间的因果关系如下:
(7.1)
(7.2)
方程7.1和7.2共同构成了一个因果模型(causality and causal model)或路径模型(path model),直观的形象表达如图7.9所示。
图7.9递归模型路径图
7.3.1基本概念
1.路径图
路径图是路径分析的前提,将理论假设的变量间关系直观的表现出来(见图7.9)。其中直线箭头表示变量间的假设因果关系,弧形箭头表示变量间的相关关系,圆形变量是指误差项如和,如果变量间没有联系,则是假定变量间没有直接关系。与回归不同,由于有的变量既是自变量又是因变量,因此路径图中的变量分为外生变量(exogenous variable,或称原因变量)和内生变量(endogenous variable,或称结果变量)两类。外生变量是指模型中起自变量作用的变量,这些变量不受模型其他变量影响,如图7.9中的,而内生变量是指受到模型中其他变量所影响的变量,包括其他的内生变量的影响,在路径图中至少有一个箭头指向它,如图7.9中的。在路径分析中,要依据变量之间的标准化的路径系数(path coefficient)测量变量间的关系,如图7.7中。
2.递归模型和非递归模型
路径模型基本可分为两类:递归模型(recursive model)和非递归模型(non-recursive model)。递归模型是指模型中变量之间只有单向的因果关系,没有直接或间接的反馈作用,且误差项之间不相关,表现在结构图中,只有单向箭头,且误差项之间没有弧形双向箭头,如图7.9所示。而在非递归模型变量间存在着直接或间接的反馈作用,在路径图中表现为存在着有直接或间接的循环箭头,如图7.10和图7.11所示,或是误差项之间有弧形的相关箭头,如图7.12所示。
图7.10非递归模型路径图
图7.11非递归模型路径图
图7.12非递归模型路径图
3.效应分解
效应分解就是将因果关系的路径系数分解为不同的效应部分,通过这一分解过程,可以发现变量间的因果关系,主要包括直接作用(direct effect)和间接作用(indirect effect)。由于变量间存在反馈效应的非递归模型的效应分解更为复杂,我们仅对常用的递归模型的效应进行分解。
(1)直接作用
直接作用是指其他变量(包括外生变量和内生变量)通过单向箭头对内生变量的直接影响,由从其他变量到内生变量的直接的路径系数来衡量。如图7.8中变量间的直接作用有五个,对的直接作用是,对的直接作用是,对的直接作用是,对的直接作用是,对的直接作用是。
(2)间接作用
间接作用是指变量对内生变量的影响还要间接地通过其他变量起作用。如果只有一个这样的中介变量,间接作用由两个路径系数的乘积来衡量。在图7.8中,可能存在两个这样的间接作用,变量对存在着直接作用,对也存在着的直接作用,因此可以推测和可能通过变量的中介作用影响变量,间接作用的大小分别是和。在递归模型中,如果中介变量的数量不止一个,那么间接作用是从原因变量到结果变量的所有路劲系数的乘积。
(3)总作用
综合直接和间接这两方面的作用,可以分析模型变量间的因果关系总的作用大小,如变量对起直接作用,作用大小分别为和。对既起直接作用又有间接作用,将直接作用和间接作用相加就是总的影响,分别为和。
7.3.2路径分析过程
为便于读者理解和掌握路径分析方法,我们首先给出路径分析的步骤和流程图。路径分析一般包括如下步骤:模型构建,即根据理论假设确定路径图;模型识别,可根据t-法则判断模型是否有解;模型拟合,主要是计算路径系数;模型评价和修正;结果分析,主要是对路径系数进行效应分解。其分析流程如图7.13所示,接下来我们将结合案例予以详细介绍。
图7.13路径分析流程图
例7.3 我们使用Leech等著“SPSS统计应用与解析”(2009)中的数据进行案例分析。该数据随机抽取美国高中75名学生作为样本,包括了学生成绩等级、数学课程类型、性别、父母教育程度以及有关数学学习态度的调查数据。我们抽取了其中父、母教育程度(mother education and mother education)、性别(gender)、能力(competence)、动机(motivation)、成绩等级(grades)等6个指标用于案例分析。表7.10为样本相关系数矩阵。
表7.10 样本相关系数矩阵
相关系数矩阵 | 父亲教育 | 性别 | 母亲教育 | 能力 | 动机 | 成绩等级 |
父亲教育 | 1.000 | |||||
性别 | -.258 | 1.000 | ||||
母亲教育 | .683 | -.197 | 1.000 | |||
能力 | .038 | -.117 | .183 | 1.000 | ||
动机 | .027 | -.183 | .099 | .521 | 1.000 | |
成绩等级 | .268 | .105 | .191 | .259 | .082 | 1.000 |
根据表7.10 的样本相关系数矩阵,我们排除了性别与能力和动机之间的可能因果关系,接下来根据变量间可能的逻辑和层次关系以及所研究问题确定变量间的可能路径。理论假设是模型构建的前提,在这一案例中,我们将主要问题设定在学生数学成绩的等级受到哪些因素的影响以及这些因素的相互关系,见图7.14。
图7.14假设模型
首先,根据大量的相关研究,我们可以合理推测,学生的数学学习成绩受到学生个人的数学学习能力和学习动机的影响,学习能力越优秀,学习动机越强烈,就应该取得更好的学习成绩,在假设模型中表现为从能力和动机到成绩等级的单向箭头。其次,许多定量和定性研究也经常讨论学生的性别和父母亲的教育程度对学生成绩差异的影响,认为父母亲的教育程度越高,学生越应取得好的数学学习成绩,因此在理论中也设定了从父亲教育、母亲教育和性别指向成绩等级的表示直接作用的单向箭头,同样,性别也往往被认为是影响学生学习成绩等级的可能因素,因而也假设了性别指向成绩的单向箭头。再次,由于家庭背景的熏陶对学生个人学习能力的培养和学习动机的形成具有重要,因此不难推测,父母亲教育对学生的数学学习能力和动机具有直接作用,父母亲的教育程度越高,学生的数学学习能力就应该越高,数学学习动机也应该越强烈。此外,学生的数学学习能力也可能受到数学学习动机的影响,学生数学学习的动机越强越有利于培养学生的数学学习能力。
2.模型拟合与参数估计
对于这一递归模型,可以使用普通最小二乘法估计模型的参数,我们采用Amos7.0软件对样本进行分析。与前文验证性因子分析类似,首先打开Amos7.0软件,根据理论绘制假设模型,如图7.14所示。
接着点击View进入Analysis Properties对话框,在Estimation的下拉菜单中选择Generalized least squares,即采用普通最小二乘法进行分析,在输出命令Output的下拉菜单中选择Standardized estimates,Sample moments,Implied moments,All implied moments,Modification indices,Indirect, direct &total effects,Factor score weights,然后关闭该对话框。
接下来输入数据。点击File按钮,在其下拉菜单中打开Data files对话框,点击File Name确定数据位置,点击View Data查看数据内容,点击OK输入数据,然后退出对话框。
下一步点击Analyze按钮,打开Calculate Estimates,软件将对数据进行分析。点击View Text按钮查看输出结果。标准化路径系数及其检验p值如表7.11所示。
表7.11 标准化路径系数
变量间关系 | 路径系数 | p值 |
动机<---母亲教育 | .156 | .363 |
动机<---父亲教育 | -.078 | .7 |
能力<---母亲教育 | .222 | .102 |
能力<---父亲教育 | -.127 | .349 |
能力<---动机 | .487 | *** |
成绩等级<---母亲教育 | -.061 | .681 |
成绩等级<---动机 | -.039 | .752 |
成绩等级<---能力 | .298 | .016 |
成绩等级<---父亲教育 | .353 | .016 |
成绩等级<---性别 | .205 | .068 |
图7.15路径系数
3.模型评价与修正
事实上,在结构方程模型方法和软件出现之前,路径分析的一大是除采用W统计量之外,难以对整个因果模型的拟合优度进行检验,结构方程模型软件可以进行路径分析,并能对整体因果模型的拟合情况进行更为全面的分析。因此这里我们对因果模型的评价包括传统的方程决定系数(coefficient of determination)R2、各种整体模型的拟合指数和参数的显著性等三个方面的检验。结构方程的决定系数R2即每个内生变量的变异量被解释的百分比,计算方法和数学原理参见何晓群编著(2004,pp.279-280),该因果模型三个结构方程分别为0.28、0.01和0.19,显然“动机”这一变量的被解释水平不高,外生变量对其解释不足。
因果模型的拟合指数如表7.12所示,模型拟合的卡方值为 2=2.349,自由度df=2,p=0.309,没有达到0.05的显著水平,表明总体模型拟合情况一般;统计量GFI、AGFI、NFI、RFI、IFI、TLI、CFI基本都大于0.8的可接受水平,并接近1.0,表明拟合情况较好。且RMSEA为0.049,一般认为该指数低于0.06表明模型有较高的拟合优度。根据以上的拟合情况,可以认为总体模型可以接受,但还有进一步调试的空间。
表7.12 因果模型的拟合度指数
Model | 2 | df | p | GFI | AGFI | NFI δ1 | RFI ρ1 | IFI δ2 | TLI ρ2 | CFI | RMSEA |
Default model | 2.349 | 2 | 0.309 | .9 | .8 | .956 | .670 | .993 | .932 | .991 | .049 |
综合模型拟合和参数检验这两方面的结果,可以考虑对模型进行修正,以寻求更优的模型。提高模型的拟合程度,修正模型的方法包括增加或减少变量、变动路径系数等,如将自由估计的参数设为固定参数或是将固定参数设为自由估计。需要注意的是,进行这些修正是需要同时考虑理论依据,使得模型修正具有合理性。在此,我们仅根据统计方面的原因将模型检验中与预测相反的五条路径的系数固定为0,并重新估计模型,修正模型拟合的路径系数如图7.16所示。
图7.16修正模型的路径系数
4.结果解释
修正模型的拟合指数以及标准化路径系数和p值如表7.13和表7.14所示。与初始模型相比,路径系数的大小及显著性有所改善,且各项拟合指数基本都达到了更高的水平,表明新的模型优于初始模型。当然,变量之间真实的关系可能更为复杂,还可能存在更佳的因果模型,需要根据理论和拟合情况进一步探索。
表7.13 因果模型的拟合度指数
Model | 2 | df | p | GFI | AGFI | NFI δ1 | RFI ρ1 | IFI δ2 | TLI ρ2 | CFI | RMSEA |
Default model | 3.671 | 6 | 0.721 | .983 | .942 | .931 | .828 | 1.000 | 1.000 | 1.000 | .000 |
变量间关系 | 路径系数 | p值 |
动机<---母亲教育 | .100 | .431 |
能力<---母亲教育 | .139 | .179 |
能力<---动机 | .488 | *** |
成绩等级<---能力 | .272 | .013 |
成绩等级<---父亲教育 | .307 | .007 |
成绩等级<---性别 | .201 | .073 |
表7.15路径系数分解
原因变量 | 结果变量 | 直接作用 | 间接作用 | 总作用 |
父亲教育 | 成绩等级 | .307 | .000 | .307 |
母亲教育 | 动机 | .100 | .000 | .100 |
能力 | .139 | .049 | .187 | |
成绩等级 | .000 | .051 | .051 | |
性别 | 成绩等级 | .201 | .000 | .201 |
动机 | 能力 | .488 | .000 | .488 |
成绩等级 | .000 | .133 | .133 | |
能力 | 成绩等级 | .272 | .000 | .272 |
路径分析不允许变量存在测量误差,也不能排除这种误差,因此在路径分析中,变量大多是可直接观测的变量。但很多变量的特点在于难以直接观察,使用单一指标来衡量往往有失偏颇,影响到整个路径模型的拟合信度和效度。类似学习、能力和动机的这些难以直接观察的变量(unobserved variable)或称为潜变量或隐变量(latent variable)在心理学、社会学、管理学等社会科学中具有重要意义,它们往往是对纷繁复杂的心理、社会现象的高度抽象,研究这些变量的关系有利于揭示现象背后深层的社会规律。通过将验证性因子分析测量因子的思想结合进路径分析,就可以成功排除潜变量的测量误差,提高路径分析的测量精度,路径分析和验证性因子分析思想的整合形成了新的数据综合处理方法——结构方程模型(Structural Equation Modeling, 简称SEM)。结构方程模型是新一代的数据分析方法和技术,提高了变量测量的精度,能够对多个潜在自变量和因变量的关系进行建模,并通过简单而系统的分析同时解决一系列相关研究问题。
例如,在路径分析中,学生数学的学习能力、动机和成绩常常是以多个指标的均值来计算的,参见Leech等(2009)。如果我们融合验证性因子分析的思想,将这三个变量作为难以直接观测的潜变量来处理,分别用多个指标来衡量,就得到了结构方程模型,变量间关系的路径图如图7.17所示。
图7.17结构方程模型的路径图
7.4.1基本概念
按照变量是否可以直接测量,结构方程模型中的变量可分为潜变量(latent variable)和显变量(manifest variable),在路径图中分别用椭圆框和方框表示,如图7.17中的能力、动机和成绩就是潜变量,从到 和到都是显变量,到都是测量误差。与路径分析一样,按照变量间的关系,可进一步将潜变量区分为外生变量(exogenous variable)和内生变量(endogenous variable),如图7.17中动机就是影响其他潜变量的外生的潜变量,而能力和成绩则是受到其他潜变量影响的内生潜变量。潜变量之间以及潜变量与显变量之间的假设关系由路径图表现出来,这些假设关系的程度通过路径系数来反映。
结构方程模型可分为测量模型(measurement equation)和结构方程(structural equation)两个部分。测量模型描述潜变量和衡量指标之间的关系,如图7.17中能力、动机和成绩与其各个衡量指标之间的关系,采用的是验证性因子分析的思想。结构模型描述的是潜变量之间的关系,如学生的动机、能力和成绩之间的因果关系,采用的是路径分析的思想。一般而言,结构方程模型通过三个矩阵方程构成:
方程(7.1)和(7.2)是描述指标与潜变量关系的测量方程,是外生潜变量的测量指标,是内生潜变量的测量指标,是外生潜变量与其相关指标之间的关系矩阵,是内生潜变量与其相关指标之间的关系矩阵,和分别是x和y的测量误差。方程(7.3)是描述潜变量关系的方程,是内生的潜变量,是外生的潜变量,代表内生潜变量之间的关系,代表外生潜变量对内生潜变量的影响,是结构方程的残差,反映了结构方程中未被解释的部分。据此,路径图7.17的结构方程模型表示为:
(其余略)
(其余略)
7.4.2结构方程模型分析过程
结构方程模型的分析过程主要包括模型构建、模型识别、数据收集、模型估计、模型评价、模型修正以及结果解释等步骤,分析过程的流程图如图7.18所示。接下来我们每一步骤做详细介绍,并在最后的案例分析中结合软件使用具体讲解。
图7.18结构方程模型分析的流程图
1.模型构建
模型构建主要包括确定显变量和潜变量以及潜变量之间的因果关系,通过绘制路径图可以直观方式表达出来,如图7.17。模型构建的质量影响到接下来的一系列分析能否顺畅,构建模型的关键是要求研究人员对研究领域有深入的理解,对变量的内在因果关系要有一定的把握。
2.模型识别
在模型构建的过程中要注意模型的识别问题,可应用t-法则来判断模型是否可识别,模型可识别的必要条件是:
其中是指可观测变量或指标的数量之和,可以产生个不同的方差或协方差。是指模型中未知参数个数。如图7.17的结构方程模型,要估计的参数包括16个误差方差、3个因子方差、3条路径系数和13个因子负荷共35个,而可以利用的观测变量是16个,因此,大大高于35个需估计参数,表明该模型是一个过度识别模型,对结构方程模型的使用者来说,一般都倾向于使用这样的模型。当然,结构方程模型的软件例如 AMOS 已将模型识别作为模型拟合过程的一部分,提供有关欠识别条件的警告。如果模型识别出现问题,一般就要重新收集数据或修改模型。
3.数据收集
数据收集和量表确定是结构方程模型构建的前提。由于结构方程模型往往需要多个指标衡量同一个潜变量,通过公开数据往往难以获得这些指标,因此很多情况下需要借助调查问卷的方式收集这些数据。结构方程模型分析中样本量也是影响分析的重要因素,一般认为样本量需在100个以上,如果可能的话达到200个更好,并且每个指标或变量应是连续值,且单变量及其联合分布要符合正态性。
对潜变量测量的显变量的量表选取的原则是量表应能够反映潜变量,一般有三个方面的要求:一是指标或题项的因子负荷须在0.4以上,以充分反映潜变量;二是衡量潜变量的指标或题项的数量一般来说也要求在4到7个,指标数量太少则难以充分反映潜变量;三是衡量潜变量的量表应尽量采用现有文献已使用的成熟量表,如果开发新的量表,则应进行探索性的因子分析,以确定能够反映潜变量的指标或题项。
4.模型估计
模型估计是通过输入样本数据,对模型的参数以及潜变量间的路径系数进行估计,目标是使得模型隐含的协方差矩阵与样本的协方差矩阵的差异最小。通常使用的估计方法包括最大似然估计法(ML, Maximum likelihood)、一般最小二乘估计法(GLS, Generalized least squares)、未加权最小二乘估计法(ULS, Unweighted least squares)、一般加权最小二乘估计法(Generally weighted least squares)等。研究者一般采用最大似然估计法和最小二乘估计法。在实际调查中,经常会出现缺失值(missing value)的情况,一般是采用列删、对删和平均数替代的方法,但由于这样做存在非正定问题,因此一般使用最大似然估计法进行估计以解决缺失值的问题。
5.模型评价
根据模型估计得到的参数,可以对模型进行评价,包括整体模型拟合情况和变量间关系检验,考察各参数估计值是否在合理范围内以及变量间关系是否与预期一致。整体模型拟合情况又包括三类检验:绝对拟合指数、相对拟合指数和简约拟合指数。绝对拟合指数是理论模型和饱和模型比较得到的统计量,如卡方 2、自由度df、拟合优度指数GFI、近似误差均方根RMSEA等;相对拟合指数是理论模型与基准模型或虚模型之间比较的统计量,基准模型是对估计参数最多的模型,如TLI、IFI、CFI等;简约拟合指数是前两类指数派生出来的指数,用以惩罚参数多的模型,如PGFI、PNFI等,这些拟合指数的构造和功能参见侯杰泰等(2005),这里不做详细说明。变量间关系的检验包括测量模型检验和结构模型检验两部分,测量模型检验主要检验指标衡量潜在变量的信度和效度,结构模型的检验主要考虑根据理论因果关系是否成立,是否具有显著性。
6.模型修正
如果模型的拟合检验没有达到可接受程度,研究者可根据理论和统计两个方面对模型进行修正。修正的方法包括调节指标间残差关系、改变指标反映的潜在变量以及根据固定部分参数或将固定参数设定为自由估计等。其步骤可能会包括构建新的模型、对新模型进行识别、估计和评价以及修正,通过这样不断的循环过程,找到更加优化的模型。在统计方面,结构方程模型的软件会提供标准化残差(standardized residual)以及修正指数(MI, modification index)等信息供修正。需要强调的是,模型的修正一定程度上是使结构方程模型从验证性的技术还原为探索性的技术,因此根据统计方面的修正必须谨慎,每项修正都应以理论为基础。如果模型的拟合情况不好,最好是要通过严谨的理论和实证两方面的研究和思考重新界定模型,并通过多个样本进行验证,以尽可能少的对模型进行修正。
7.结果解释
最后是对通过上述检验的模型或修正模型的结果进行解释,包括变量间的作用关系和和效果解释。变量间关系解释包括显变量或指标与潜变量间的关系、外生潜变量和内生潜变量间的关系以及内生潜变量间的关系,类似于路径分析中的路径系数。结构方程模型软件会提供未标准化和标准化的系数估计,须根据研究问题决定采用哪种系数估计。效果解释同样是对变量间关系进行解释,包括了直接作用、间接作用和总作用,与前述路径分析的效应分解相似。
7.5结构方程模型的应用举例
由本章以上分析可知,结构方程模型方法同样可以用来处理验证性因子分析、路径分析问题,本节在这些分析的基础上,专门就结构方程模型的应用重点加以说明,并解释软件处理结果。出于与路径分析比较的方便,我们在结构方程模型的案例分析中仍使用路径分析中的样本数据,但根据结构方程模型的特点改动了变量的衡量方法。首先,在上述路径分析的案例中,将能力和动机两个变量作为可以直接观测变量来处理,都是以问卷调查的10个题项得分的均值来衡量,与此方法不同,在本案例中,我们将数学的学习动机和学习能力作为潜变量,借助验证性因子分析思想从样本数据的10个题项中析出因子,这样的数据处理应更具精确性,反映了结构方程模型处理技术的优越性。其次,数学的学习成绩我们不仅用高中时成绩等级来衡量,而且囊括了包括成绩等级在内的6个指标来衡量。这三个潜变量的测量模型如表7.16所示。当然,在本案例中,性别、父母教育程度的指标仍保持不变。接下来,我们采用Amos7.0软件进行分析。
表7.16潜变量的测量模型
潜变量 | 测量指标 | 问题描述 |
动机 | x1 | 我喜欢做数学技能训练,直到做好为止 |
x2 | (反向题)如果遇到数学难题,我坚持做难题,而把容易做的题放弃 | |
x3 | 我更喜欢没有寻求帮助下找到任何如何解决问题的办法 | |
x4 | (反向题)当数学问题遇到挑战时,我不能坚持很长时间 | |
x5 | 即使花很多时间,我也要做完数学题 | |
x6 | 我试图用各种方法解决一个难题,然后再做下一道题 | |
能力 | y1 | 我能很快做出数学题 |
y2 | (反向题)我对数学新知识的掌握有点儿慢 | |
y3 | 我在数学方面是有能力的 | |
y4 | (反向题)我和我同龄的孩子比,我做数学题有些困难 | |
成绩 | y5 | 高中成绩等级 |
y6 | 数学测验成绩 | |
y7 | 拼图测试得分 | |
y8 | 想象力测试得分 | |
y9 | 想象力再测试得分 | |
y10 | 学生智能测验—数学分数 |
首先,我们打开Amos7.0软件,如图7.19所示。根据理论假设绘制变量及变量间因果关系的路径图,见图7.20。与路径分析一样,在这一案例中,我们仍将主要问题设定在学生成绩受到哪些因素的影响以及这些因素的相互关系上。这些理论假设参见本章路径分析中模型构建部分,在此不再赘述。由图7.20和图7.14比较可以发现,本案例中的结构方程模型仅仅将动机、能力和成绩转变成为需要由观测变量衡量的潜变量,而父亲教育、母亲教育和性别及这些变量与动机、能力和成绩之间的假设因果关系均保持不变。
图7.19
图7.20假设关系模型
2.数据输入和分析
点击View=>Analysis Properties对话框,在Estimation的下拉菜单中选择Maximum likelihood,即采用最大似然法进行拟合。如图7.21所示。
图7.21
接着,在输出命令Output的下拉菜单中选择Standardized estimates,Sample moments,Implied moments,All implied moments,Residual moments,Modification indices,Indirect,direct &total effects,Factor score weights,Covariances of estimates,Correlations of estimates,如图7.22所示。然后退出Analysis Properties对话框。
图7.22
下一步,点击File按钮,在其下拉菜单中打开Data files对话框,点击File Name确定数据位置,点击View Data查看数据内容,点击OK输入数据,如图7.23所示,然后退出对话框。
图7.23
接下来点击Analyze按钮,打开Calculate Estimates,软件将对数据进行分析。点击View Text按钮查看输出结果。同时可以在主对话框点击View the output path diagram,得到直观的路径系数,如图7.24所示。
图7.24变量间关系
3.模型评价
结构方程模型的评价首先要检验整体模型,在整体模型拟合情况的基础上,可进一步对模型变量间关系进行检验,一般需分两步进行,一是对测量模型的信度和效度进行检验,二是对结构模型变量间关系及其显著性进行检验。
(1)整体模型检验
判断整体模型拟合情况的指数通常有多个,主要以模型分析结果的卡方值、自由度、RMSEA、GFI、AGFI、NFI、CFI、IFI等数值作为判别标准。一般来说,卡方值除以自由度的 2/df小于5表示模型可以接受,小于3则模型拟合较好。GFI是模型拟合优度指数,考察观测变量的协方差矩阵与再生的协方差矩阵的匹配关系,其值域在0到1之间,越接近1说明模型拟合优度越高。类似地,其他的拟合指数AGFI、NFI、CFI、IFI一般要求大于0.8,且越接近1,说明模型拟合的越好。通常认为,RMSEA低于0.1模型就可以接受,低于0.08表示拟合较好,低于0.06则表示模型拟合的非常好。
本案例中整体模型的拟合指数如表7.17所示,卡方和自由度为 2=308.4、df=142, 2/df=2.2,表明模型具有较好的拟合优度。统计量GFI、AGFI、NFI、RFI、IFI、TLI、CFI都低于0.8的可接受水平,表明模型拟合效果不佳。统计量RMSEA为0.126,表明模型拟合的优度不高。综合考虑这几类统计量,可以认为模型拟合优度一般,模型仍需要改进。
表7.17总体模型的拟合度指数
Model | 2 | df | GFI | AGFI | NFI δ1 | RFI ρ1 | IFI δ2 | TLI ρ2 | CFI | RMSEA |
Default model | 308.4 | 142 | .736 | .7 | .583 | .498 | .722 | .8 | .708 | .126 |
对测量模型的评价一般包括内部一致性(Internal consistency)、内敛效度(Convergent validity)和判别效度(Discriminant validity)三项检验。
一般认为,当潜变量各指标计算的Cronbach’s α值大于0.7时,说明各指标或题项具有衡量相同构念的能力, 但是通常大于0.5就可以接受。由于Amos没有自带这一运算,我们应用SPSS16.0软件中的一致性信度分析方法(Reliability Analysis)分析动机、能力和成绩这三个潜变量的内部一致性。打开SPSS16.0软件,在Analyze中选择Scale,打开Reliability analysis菜单,将动机、能力和成绩各指标分别输入到items框中,点击OK输出结果。输出结果如表7.18所示,潜变量的Cronbach’s α值都在0.7以上,表明潜变量具有较好的内部一致性和信度。
表7.18变量的一致性检验
一致性检验 | 动机 | 能力 | 成绩 |
潜变量Cronbach’s α值 | .799 | .741 | .809 |
项目数 | 6 | 4 | 6 |
表7.19测量模型的路径系数
变量间关系 | 相关系数 | p值 |
y1<---能力 | .7 | |
y2<---能力 | .849 | *** |
y3<---能力 | .434 | *** |
y4<---能力 | .674 | *** |
y5<---动机 | .517 | .002 |
y6<---动机 | .680 | *** |
y7<---动机 | .817 | *** |
y8<---动机 | .6 | *** |
y9<---动机 | .494 | .003 |
y10<---动机 | .463 | |
y11<---成绩 | .503 | |
y12<---成绩 | .988 | *** |
y13<---成绩 | .208 | .090 |
y14<---成绩 | .433 | .002 |
y15<---成绩 | .476 | *** |
y16<---成绩 | .794 | *** |
表7.20测量模型效度评价
潜变量 | AVE平方根 | 潜变量相关系数矩阵 | ||
动机 | 能力 | 成绩 | ||
动机 | .695 | 1.000 | ||
能力 | .621 | .567 | 1.000 | |
成绩 | .624 | .315 | .365 | 1.000 |
表7.21和图7.20给出了包括测量模型和结构模型在内的完整拟合结果。据此,我们可以对本案例的理论假设进行验证。由表7.21可见,数学学习动机对数学学习能力的作用非常大,且在0.01水平上具有显著性,与我们的预测是一致的。尽管未通过p值检验,母亲教育对数学学习动机和能力的影响、父亲教育对数学学习成绩的影响以及数学系学习能力对数学学习成绩的作用都很大,这点与预测具有一致性。但母亲教育对成绩的作用、父亲教育对能力和动机的影响以及性别对成绩的作用均较小或为负数,且不具有统计显著性,与理论预测相违背。与前面的路径分析中的案例相比,动机对成绩的影响系数很大,与理论预测一致,这点反映了结构方程模型分析中使用潜变量的优势,尽管该系数也未通过显著性检验。
表7.21模型标准化路径系数
变量间关系 | 路径系数 | p值 | 检验结果 |
动机<---母亲教育 | .199 | .269 | 不支持 |
动机<---父亲教育 | -.070 | .687 | 不支持 |
能力<---母亲教育 | .230 | .125 | 不支持 |
能力<---父亲教育 | -.144 | .324 | 不支持 |
能力<---动机 | .2 | .003 | 支持 |
成绩<---母亲教育 | .042 | .775 | 不支持 |
成绩<---动机 | .113 | .524 | 不支持 |
成绩<---能力 | .261 | .155 | 不支持 |
成绩<---父亲教育 | .276 | .077 | 不支持 |
成绩<---性别 | -.181 | .107 | 不支持 |
4.模型修正
一般认为,采用结构方程模型方法进行数据分析时,应根据拟合情况调节模型,直到找到可以接受的模型。根据上述的检验结果,我们对模型进行了修正,修正后的路径图如图7.25所示。我们删除了性别这一变量,固定了与理论相违背的一些路径,包括将父亲与能力和动机、母亲教育与成绩的路径系数固定为0,删除了因子负荷低于0.4的指标,并将误差项和设定为自由估计,参见表7.22的修正指数表。
图7.25修正模型
表7.22修正指数
变量间关系 | M.I. | Par Change |
e16<-->父亲教育 | 6.387 | -34.124 |
e14<--> e15 | 54.794 | 7.966 |
e11<-->性别 | 8.304 | .217 |
e11<--> e17 | 4.627 | .209 |
e5<--> e17 | 27.408 | .313 |
e6<--> e16 | 4.554 | 10.372 |
e6<--> e5 | 4.991 | -.155 |
e7<--> e14 | 4.099 | .601 |
e8<--> e17 | 4.509 | -.108 |
e8<--> e6 | 5.039 | .132 |
e10<--> e9 | 16.845 | .248 |
e4<--> e6 | 4.704 | .106 |
e4<--> e8 | 4.859 | .106 |
e4<--> e10 | 4.129 | -.099 |
e3<--> e9 | 8.955 | .175 |
e2<--> e5 | 17.951 | .265 |
e2<--> e8 | 7.321 | -.144 |
图7.26变量间关系
修正模型的拟合指数如表7.23所示,卡方和自由度为 2=172.8、df=113, 2/df=1.5,表明模型具有较好的拟合优度。统计量GFI、AGFI、NFI、RFI、IFI、TLI、CFI基本在0.7以上,与初始模型相比,具有更好的拟合效果。统计量RMSEA为0.085,表明拟合的优度较高。根据这几类统计量,可以认为模型拟合优度较好,可以接受。
表7.23修正模型的拟合指数
Model | 2 | df | GFI | AGFI | NFI δ1 | RFI ρ1 | IFI δ2 | TLI ρ2 | CFI | RMSEA |
Default model | 172.8 | 113 | .795 | .722 | .750 | .699 | .6 | .870 | .2 | .085 |
由于总体模型拟合情况较好,接下来我们可以进一步检验理论假设,如表7.24所示。在修正模型中,数学学习动机对数学学习能力的作用继续得到支持。父亲教育对学生数学学习成绩的影响得到了支持,并且路径系数在0.01水平上具有显著性,与理论预测具有一致性,而在初始模型的检验中这点没有得到支持。此外,其他假设与初始模型的结论基本相符,可见修正模型提高了拟合的效果,与初始模型相比较也更为合理。
表7.24 修正模型的标准化路径系数
变量间关系 | 路径系数 | p值 | 检验结果 |
动机<---母亲教育 | .151 | .251 | 不支持 |
能力<---母亲教育 | .130 | .233 | 不支持 |
能力<---动机 | .8 | .003 | 支持 |
成绩<---动机 | .152 | .375 | 不支持 |
成绩<---能力 | .233 | .174 | 不支持 |
成绩<---父亲教育 | .344 | .004 | 支持 |
表7.25路径系数分解
原因变量 | 结果变量 | 直接作用 | 间接作用 | 总作用 |
父亲教育 | 成绩 | .344 | .000 | .344 |
母亲教育 | 动机 | .151 | .000 | .151 |
能力 | .130 | .098 | .228 | |
动机 | 能力 | .8 | .000 | .8 |
成绩 | .152 | .151 | .303 | |
能力 | 成绩 | .233 | .000 | .233 |