
题目2 数据data2是某医院3年中各月的数据,包括门诊人次、出院人数、病床利用率和周转次数、平均住院天数、治愈或好转率、病死率、诊断符合率、抢救成功率。采用因子分析法探讨综合评价指标。
一、因子分析法
因子分析是主成分分析的推广和发展,也是利用降维方法进行统计分析的一种多元统计方法。它是一种将多变量化简的技术,其目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,不同类间变量的相关性则降低。每一类变量代表了一个“共同因子”,即一种内在结构,因子分析就是要寻找该结构。
因子分析有一个默认的前提条件就是各变量间必须有相关性,否则,各变量间没有共享信息,就不应当有公因子需要提取,自然也谈不上使用该方法。具体在该条件的判断上,除了根据专业知识来估计外,还可以使用KMO统计量和Bartlett’s 球形检验加以判定。
二、操作步骤
1.导入数据
依次单击“文件—打开—数据文件”命令,打开如图1所示的对话框。
图1 导入数据
2.因子分析
(1)依次单击“分析—降维—因子分析”命令,如图2所示。打开图3所示的“因子分析”主对话框。
图2 因子分析菜单
(a)选入变量前
(b)选入变量后
图3 “因子分析”主对话框
(2)在图3(a)所示的对话框中选中左边的变量,单击 按钮,将其选入到左边的列表框中(如图3a所示)。
(3)单击“描述”按钮,弹出“因子分析:描述统计”对话框,如图4所示,在“统计量”选项组中选取“原始分析结果”;在“相关矩阵”中选取“系数”和“KMO和Bartlett”。设置完毕后,单击“继续”按钮,确认操作。
图4 “因子分析:描述”对话框
图5 “因子分析:抽取”对话框
(4)单击“抽取”按钮,得到如图5所示的“因子分析:抽取”对话框。选择“方法”为“主成分”;在“分析”选项组选择“相关性矩阵”;在“输出”选项组选择“未旋转的因子解”和“碎石图”;在“提取”选项组中将“因子的固定数量:”设置为4;将“最大收敛性迭代次数:”设置为25.
(5)单击“旋转”按钮,得到如图6所示的“因子分析:旋转”对话框。在“方法”选项组选择“最大四次方值法”;在“输出”选项组选择“旋转解”;将“最大收敛性迭代次数:”设置为25。
(6)单击“得分”按钮,得到如图7所示的“因子分析:得分”对话框。选择“保存为新变量”和“显示因子得分系数矩阵”;在“方法”选项组选择“回归”。
最后,在“因子分析”主对话框(如图3所示)中,单击“确定”按钮,执行操作。
图6 “因子分析:旋转”对话框
图7 “因子分析:因子得分”对话框
3.结果解释
(1)相关性分析
表1 相关矩阵
| 相关矩阵 | ||||||||||
| 门诊人次 | 出院人数 | 病床利用率 | 病床周转数 | 平均住院天数 | 治愈好转率 | 病死率 | 诊断符合率 | 抢救成功率 | ||
| 相关 | 门诊人次 | 1.000 | .044 | .283 | .288 | .326 | -.118 | -.024 | .347 | -.425 | 
| 出院人数 | .044 | 1.000 | .084 | .572 | -.420 | .132 | -.210 | -.343 | .505 | |
| 病床利用率 | .283 | .084 | 1.000 | .678 | -.110 | -.038 | -.123 | .129 | -.088 | |
| 病床周转数 | .288 | .572 | .678 | 1.000 | -.412 | -.055 | -.297 | -.202 | .235 | |
| 平均住院天数 | .326 | -.420 | -.110 | -.412 | 1.000 | .297 | .093 | .416 | -.418 | |
| 治愈好转率 | -.118 | .132 | -.038 | -.055 | .297 | 1.000 | -.380 | -.068 | .007 | |
| 病死率 | -.024 | -.210 | -.123 | -.297 | .093 | -.380 | 1.000 | .079 | -.284 | |
| 诊断符合率 | .347 | -.343 | .129 | -.202 | .416 | -.068 | .079 | 1.000 | -.449 | |
| 抢救成功率 | -.425 | .505 | -.088 | .235 | -.418 | .007 | -.284 | -.449 | 1.000 | |
| KMO 和 Bartlett 的检验 | ||
| 取样足够度的 Kaiser-Meyer-Olkin 度量。 | .490 | |
| Bartlett 的球形度检验 | 近似卡方 | 119.028 | 
| df | 36 | |
| Sig. | .000 | |
(2)主成分信息
表3 主成分信息
| 解释的总方差 | |||||||||
| 成份 | 初始特征值 | 提取平方和载入 | 旋转平方和载入 | ||||||
| 合计 | 方差的 % | 累积 % | 合计 | 方差的 % | 累积 % | 合计 | 方差的 % | 累积 % | |
| 1 | 2.807 | 31.194 | 31.194 | 2.807 | 31.194 | 31.194 | 2.628 | 29.201 | 29.201 | 
| 2 | 1.991 | 22.124 | 53.317 | 1.991 | 22.124 | 53.317 | 1.854 | 20.603 | 49.804 | 
| 3 | 1.448 | 16.092 | 69.410 | 1.448 | 16.092 | 69.410 | 1.471 | 16.339 | 66.144 | 
| 4 | .785 | 8.723 | 78.133 | .785 | 8.723 | 78.133 | 1.079 | 11.9 | 78.133 | 
| 5 | .681 | 7.563 | 85.696 | ||||||
| 6 | .541 | 6.014 | 91.710 | ||||||
| 7 | .453 | 5.034 | 96.744 | ||||||
| 8 | .175 | 1.939 | 98.683 | ||||||
| 9 | .119 | 1.317 | 100.000 | ||||||
| 提取方法:主成份分析。 | |||||||||
(3)变量的共同度
表4 变量的共同度
| 公因子方差 | ||
| 初始 | 提取 | |
| 门诊人次 | 1.000 | .879 | 
| 出院人数 | 1.000 | .870 | 
| 病床利用率 | 1.000 | .866 | 
| 病床周转数 | 1.000 | .917 | 
| 平均住院天数 | 1.000 | .770 | 
| 治愈好转率 | 1.000 | .796 | 
| 病死率 | 1.000 | .6 | 
| 诊断符合率 | 1.000 | .565 | 
| 抢救成功率 | 1.000 | .681 | 
| 提取方法:主成份分析。 | ||
图8 碎石图
表2显示,每一个变量的公因子方差均在0.5以上,且大多数接近或超过0.7,这说明4个公因子能够较好地反映客观原变量的大部分信息。另外,从碎石图可以看出因子1、2、3、4之间的连线比较陡峭,说明特征值的差值较大,前四个因子比较重要。这和上表的结果是吻合的。
(4)旋转前的因子负荷矩阵(如表3所示)
表5 旋转前的因子负荷矩阵
| 成份矩阵a | ||||
| 成份 | ||||
| 1 | 2 | 3 | 4 | |
| 门诊人次 | -.255 | .770 | .008 | .470 | 
| 出院人数 | .766 | .128 | .091 | .508 | 
| 病床利用率 | .244 | .776 | -.086 | -.443 | 
| 病床周转数 | .6 | .661 | -.071 | -.020 | 
| 平均住院天数 | -.724 | .125 | .440 | .1 | 
| 治愈好转率 | .039 | -.071 | .888 | -.009 | 
| 病死率 | -.405 | -.1 | -.663 | .243 | 
| 诊断符合率 | -.623 | .402 | .041 | -.116 | 
| 抢救成功率 | .737 | -.366 | .059 | .021 | 
| 提取方法 :主成分分析法。 | ||||
| a. 已提取了 4 个成份。 | ||||
(5)正交旋转矩阵(如表4所示)
表6 正交旋转矩阵
| 成份转换矩阵 | ||||
| 成份 | 1 | 2 | 3 | 4 | 
| 1 | -.8 | .395 | .153 | .117 | 
| 2 | .410 | .783 | .027 | .466 | 
| 3 | .115 | -.140 | .980 | .077 | 
| 4 | -.109 | -.459 | -.122 | .873 | 
| 提取方法 :主成分分析法。 旋转法 :具有 Kaiser 标准化的四分旋转法。 | ||||
(6)旋转后的因子负荷矩阵(如表5所示)
表7 旋转后的因子负荷矩阵
| 旋转成份矩阵a | ||||
| 成份 | ||||
| 1 | 2 | 3 | 4 | |
| 门诊人次 | .494 | .286 | -.068 | .740 | 
| 出院人数 | -.680 | .157 | .147 | .601 | 
| 病床利用率 | .137 | .920 | .028 | -.003 | 
| 病床周转数 | -.354 | .809 | .056 | .366 | 
| 平均住院天数 | .732 | -.337 | .301 | .173 | 
| 治愈好转率 | .039 | -.160 | .876 | .033 | 
| 病死率 | .193 | -.307 | -.746 | .037 | 
| 诊断符合率 | .742 | .116 | -.030 | .016 | 
| 抢救成功率 | -.808 | -.013 | .158 | -.061 | 
| 提取方法 :主成分分析法。 旋转法 :具有 Kaiser 标准化的四分旋转法。 | ||||
| a. 旋转在 5 次迭代后收敛。 | ||||
通过探索性因子分析,从这9个变量中找到了4个潜在因子,它们是:综合因子、病床利用因子、水平因子和数量因子,如下表所示。
| 因子 | 高负荷指标 | 因子名称 | 
| 因子一 | x1(门诊人数) | 综合因子 | 
| x2(出院人数) | ||
| x5(平均住院天数) | ||
| x8(诊断符合率) | ||
| x9(抢救成功率) | ||
| 因子二 | x3(病床利用率) | 病床利用因子 | 
| x4(病床周转数) | ||
| 因子三 | x6(治愈好转率) | 水平因子 | 
| x7(病死率) | ||
| 因子四 | x1(门诊人数) | 数量因子 | 
| x2(出院人数) | 
Thanks for your attention!
