
2012 年 月 日
| 学院 | 经贸学院 | 姓名 | 学号 | ||||
| 实验 名称 | 实验成绩 | ||||||
| 一、实验目的 (一)利用SPSS对主成分回归进行计算机实现. (二)要求熟练软件操作步骤,重点掌握对软件处理结果的解释. 二、实验内容 以教材例题7.2为实验对象,应用软件对例题进行操作练习,以掌握多元统计分析方法的应用 三、实验步骤(以文字列出软件操作过程并附上操作截图) 1、数据文件的输入或建立:(文件名以学号或姓名命名) 将表7.2数据输入spss:点击“文件”下“新建”——“数据”见图1: 图1 点击左下角“变量视图”首先定义变量名称及类型:见图2: 图2: 然后点击“数据视图”进行数据输入(图3): 图3 完成数据输入 2、具体操作分析过程 : (1)首先做因变量Y与自变量X1-X3的普通线性回归: 在变量视图下点击“分析”菜单,选择“回归”-“线性”(图4): 图4 将因变量Y调入“因变量”栏,将x1-x3调入“自变量”栏(图5): 然后选择相关要输出的结果:①点击右上角“统计量(s)”:“回归系数”下选择“估计”;“残差”下选择“D.W”;在右上角选择输出“模型拟合度”、“部分相关和偏相关”“共线性诊断”(后两项是做多重共线性检验)。选完后点击“继续”(见图6)②如果需要对因变量与残差进行图形分析则需要在“绘制”下选择相关项目(图7),一般不需要则继续③如果需要将相关结果如因变量预测值、残差等保存则点击“保存”(图8),选择要保存的项目④如果是逐步回归法或者设置不带常数项的回归模型则点击“选项”(图9) 其他选项按软件默认。最后点击“确定”,运行线性回归,输出相关结果(见表1-3) 图5 图6 图7 图8 图9 回归分析输出结果: 表1 模型汇总b | |||||||
| 模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 | Durbin-Watson | ||
| 1 | .996a | .992 | .988 | .48887 | 2.740 | ||
| a. 预测变量: (常量), x3, x2, x1。 | |||||||
| b. 因变量: y | |||||||
| Anovab | ||||||
| 模型 | 平方和 | df | 均方 | F | Sig. | |
| 1 | 回归 | 204.776 | 3 | 68.259 | 285.610 | .000a | 
| 残差 | 1.673 | 7 | .239 | |||
| 总计 | 206.449 | 10 | ||||
| a. 预测变量: (常量), x3, x2, x1。 | ||||||
| b. 因变量: y | ||||||
| 系数a | |||||||||||
| 模型 | 非标准化系数 | 标准系数 | t | Sig. | 相关性 | 共线性统计量 | |||||
| B | 标准 误差 | 试用版 | 零阶 | 偏 | 部分 | 容差 | VIF | ||||
| 1 | (常量) | -10.128 | 1.212 | -8.355 | .000 | ||||||
| x1 | -.051 | .070 | -.339 | -.731 | .488 | .965 | -.266 | -.025 | .005 | 185.997 | |
| x2 | .587 | .095 | .213 | 6.203 | .000 | .251 | .920 | .211 | .981 | 1.019 | |
| x3 | .287 | .102 | 1.303 | 2.807 | .026 | .972 | .728 | .095 | .005 | 186.110 | |
| a. 因变量: y | |||||||||||
(2)自变量x1-x3的主成分分析:
由于spss没有的主成分分析模块,需要在因子分析里完成,因此需要特别注意:
在数据窗口下选择“分析”—“降维”—“因子分析”(见图10);
在弹出的窗口中将x1-x3调入“变量”(见图11);
然后①点击“描述”,选择要输出的统计量(见图12):选中“统计量”下的两个项目(输出变量描述统计和初始分析结果);在“相关矩阵”一般要选择输出“系数”、“显著性水平”、“KMO”(做主成分分析和因子分析的适用性检验,也就是检验变量之间的相关系数是否足够大可以做因子分析)选完后点击“继续”进行下一步;②点击“抽取”(见图13):在“方法”下默认“主成分”;“分析”下,默认“相关性矩阵”(含义是要对变量做标准化处理,然后基于标准化后的协差阵也就是相关阵进行分解做因子分析或主成分分析),如果不需要对变量做标准化处理就选“协方差矩阵”;“输出”中的两项都选,要求输出没有旋转的因子解(主成分分析必选项)和碎石图(用图形决定提取的主成分或因子的个数);“抽取“下,默认的是基于特征值(大于1表示提取的因子或主成分至少代表1个单位标准差的变量信息,因为标准化后的变量方差为1,因子或者主成分作为提取的综合变量应该至少代表1个变量的信息),也可以自选提取的因子个数(即第二项),本例中做主成分回归,选择提取全部可能的3个主成分,所以自选个数填3。选完后点击 “继续”进行下一步;③点击“旋转”(图14),按默认的“方法”下不旋转(注意,主成分分析不能旋转!)其他不用选,点击“继续”进行下一步;④点击“得分”,计算不旋转的初始因子得分(图15),选中“保存为变量”,“方法”下按默认,其他不修改,点击“继续”进行下一步。⑤“选项”下可以不选按默认(选项里主要针对缺失值和系数显示格式,不影响分析结果)
最后点击“确定”,运行因子分析。
图10
图11
图12
图13
图14
图15
由运行结果计算主成分:
| 表4、描述统计量 | |||
| 均值 | 标准差 | 分析 N | |
| x1 | 194.5909 | 29.99952 | 11 | 
| x2 | 3.3000 | 1.924 | 11 | 
| x3 | 139.73 | 20.63440 | 11 | 
| 表5、相关矩阵 | ||||
| x1 | x2 | x3 | ||
| 相关 | x1 | 1.000 | .026 | .997 | 
| x2 | .026 | 1.000 | .036 | |
| x3 | .997 | .036 | 1.000 | |
| Sig.(单侧) | x1 | .470 | .000 | |
| x2 | .470 | .459 | ||
| x3 | .000 | .459 | ||
| 表6、KMO 和 Bartlett 的检验 | ||
| 取样足够度的 Kaiser-Meyer-Olkin 度量。 | .492 | |
| Bartlett 的球形度检验 | 近似卡方 | 42.687 | 
| df | 3 | |
| Sig. | .000 | |
| 表7、解释的总方差 | ||||||
| 成份 | 初始特征值 | 提取平方和载入 | ||||
| 合计 | 方差的 % | 累积 % | 合计 | 方差的 % | 累积 % | |
| 1 | 1.999 | 66.638 | 66.638 | 1.999 | 66.638 | 66.638 | 
| 2 | .998 | 33.272 | 99.910 | .998 | 33.272 | 99.910 | 
| 3 | .003 | .090 | 100.000 | .003 | .090 | 100.000 | 
| 提取方法:主成份分析。 | ||||||
| 表8、成份矩阵a | |||
| 成份 | |||
| 1 | 2 | 3 | |
| x1 | .999 | -.036 | .037 | 
| x2 | .062 | .998 | .000 | 
| x3 | .999 | -.026 | -.037 | 
| 提取方法 :主成份。 | |||
| a. 已提取了 3 个成份。 | |||
F1=0.7066X1*+0.0439X2*+0.7066X3*(式1)
F2=-0.0360X1*+0.9990X2*-0.0260X3*(式2)
其中X1*-X3*表示为标准化变量(这是因为在进行主成分分析时是以标准化变量进行分析的,是从相关阵出发分析的,见图13的选项)。
由于主成分互不相关,可以用提取的主成分代替自变量进行回归分析,因此需要计算主成分得分来代替自变量X1-X3。主成分的计算:依据式1和2中两个主成分的表达式,对各自变量标准化后带入就可以计算出每个样品的主成分得分。但是在spss中,由因子分析提取时是用主成分法提取的,根据初始因子与主成分的关系,未旋转的初始因子等于主成分除以特征根的平方根,因此主成分得分等于因子得分乘以特征根的平方根,因此可以由因子得分计算主成分得分。前面在因子分析选项中保存了因子得分(见图15),因此计算两个主成分得分:点击“转换”—“计算变量”(图16):在弹出的窗口分别定义主成分F1=第一因子得分*第一特征根的平方根(图17)和F2=第二因子得分*第二特征根的平方根。
(3)主成分回归过程:
要做主成分回归,需要用标准化的因变量(因为自变量经过标准化处理做主成分分析,因变量需要对应做标准化)与主成分做回归,对因变量Y做标准化处理,点击“分析”—“描述统计”—“描述”(见图18),在弹出窗口中将Y调入变量,并选中“将标准化得分另存为变量”(图19)后确定完成Y的标准化。
点击“分析”---“回归”---“线性”(图20)在弹出窗口(图21)中将Zscore(y)调入因变量,F1和F2调入自变量,其他选项同前面图6-9,然后点击“确定”运行主成分回归,相关输出结果见表9
图16
图17
图18
图19
图20
图21
主成分回归结果:
| 表9、模型汇总 | ||||||||||||||||||
| 模型 | R | R 方 | 调整 R 方 | 标准 估计的误差 | ||||||||||||||
| 1 | .994a | .988 | .985 | .12104901 | ||||||||||||||
| a. 预测变量: (常量), F1, F2。 | ||||||||||||||||||
| 表10、Anovab | ||||||||||||||||||
| 模型 | 平方和 | df | 均方 | F | Sig. | |||||||||||||
| 1 | 回归 | 9.883 | 2 | 4.941 | 337.230 | .000a | ||||||||||||
| 残差 | .117 | 8 | .015 | |||||||||||||||
| 总计 | 10.000 | 10 | ||||||||||||||||
| a. 预测变量: (常量), F1, F2。 b. 因变量: Zscore(y) | ||||||||||||||||||
| 表11、系数a | ||||||||||||||||||
| 模型 | 非标准化系数 | 标准系数 | t | Sig. | 共线性统计量 | |||||||||||||
| B | 标准 误差 | 试用版 | 容差 | VIF | ||||||||||||||
| 1 | (常量) | -3.043E-16 | .036 | .000 | 1.000 | |||||||||||||
| F2 | .191 | .038 | .191 | 4.993 | .001 | 1.000 | 1.000 | |||||||||||
| F1 | .690 | .027 | .976 | 25.486 | .000 | 1.000 | 1.000 | |||||||||||
| a. 因变量: Zscore(y) | ||||||||||||||||||
Y*=0.4806X1*+0.2211X2*+0.4826X3*,还原为原始变量:
整理得最终回归结果:
| Y=-9.13+0.072X1+0.60X2+0.1062X3 | 
