最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 正文

因子分析与主成分分析

来源:动视网 责编:小OO 时间:2025-09-24 08:46:34
文档

因子分析与主成分分析

目录1.问题描述22.因子分析22.1数据基本分析22.2因子旋转32.3因子得分43.主成分分析53.1相关系数分析53.2主成分分析51.问题描述对美国洛杉矶12个人口调查区的5个经济学变量的数据进行主成分分析与因子分析,数据如下:表1编号总人口中等学校均龄总雇员数专业服务项目数中等房价1570012.82500270250002100010.96001010000334008.810001090004380013.61700140250005400012.8160014025000682
推荐度:
导读目录1.问题描述22.因子分析22.1数据基本分析22.2因子旋转32.3因子得分43.主成分分析53.1相关系数分析53.2主成分分析51.问题描述对美国洛杉矶12个人口调查区的5个经济学变量的数据进行主成分分析与因子分析,数据如下:表1编号总人口中等学校均龄总雇员数专业服务项目数中等房价1570012.82500270250002100010.96001010000334008.810001090004380013.61700140250005400012.8160014025000682
目录

1.    问题描述    2

2.    因子分析    2

2.1 数据基本分析    2

2.2 因子旋转    3

2.3 因子得分    4

3.    主成分分析    5

3.1 相关系数分析    5

3.2 主成分分析    5

1.问题描述

对美国洛杉矶12个人口调查区的5个经济学变量的数据进行主成分分析与因子分析,数据如下:

表1

编号总人口中等学校均龄总雇员数专业服务项目数中等房价
1570012.8250027025000
2100010.96001010000
334008.81000109000
4380013.6170014025000
5400012.8160014025000
682008.326006012000
7120011.44001016000
8910011.533006014000
9990012.5340018018000
10960013.7360039025000
1196009.633008012000
12940011.4400010013000
2.因子分析

2.1 数据基本分析

KMO和球形Barlett的检验用于因子分析的适用性检验。KMO检验变量间的偏相关是否较小,球形Barlett检验是判断相关阵是否是单位阵,由SPSS因子分析输出如下表:

表2

KMO 和 Bartlett 的检验

取样足够度的 Kaiser-Meyer-Olkin 度量

.575
Bartlett 的球形度检验

近似卡方54.252
df10
Sig..000

    由Bartlett 检验可以看出,应拒绝各变量的假设,即变量间具有较强的相关性。但是KMO 统计量为0.575<0.7,说明各变量问信息的重叠程度可能不是特别的高,有可能做出的因子分析模型不是很完善,但还是值得尝试的。

    公因子方差是    表示各变量中所含原始信息能被提取的公因子所表示的程度,由下表中所示的变量共同度可知:几乎所有变量共同度都在80% 以上,因此提取出的这几个公因子对各变量的解释能力是较强的。

表3

公因子方差
初始提取
总人口1.000.988
中等学校平均校龄1.000.885
总雇员数1.000.979
专业服务项目数1.000.880
中等房价1.000.938
提取方法:主成份分析。

    碎石图用于显示各因子的重要程度,其横轴为因子序号,纵轴表示特征根大小。它将因子按特征根从大到小依次排列,从中可以非常直观的了解到哪些是最主要的因子。前面陡峭的对应较大的特征根,作用明显;后面的平台对应较小的特征根,其影响不明显。本例中可见前两个个因子的散点位于陡坡上,而后三个因子散点形成了平台,且特征根均小于1,因此至多考虑前两个公因子即可。

2.2 因子旋转

        由SPSS因子分析并采用最大方差旋转法输出方差累计贡献率表如下:

    

表4: 解释的总方差

成份初始特征值提取平方和载入旋转平方和载入
合计方差的 %

累积 %

合计方差的 %

累积 %

合计方差的 %

累积 %

12.87357.46657.4662.87357.46657.4662.52250.43750.437
21.79735.93393.3991.79735.93393.3992.14842.96393.399
3.2154.29797.696
4.1001.99999.695
5.015.305100.000
提取方法:主成份分析。
由上表可知,前两个特征值大于1,前两个因子的方差总贡献率已达到93.399%,因此前两个因子就可以描述原变量的绝大部分信息。

同时输出旋转后的因子载荷矩阵如下表:

表5:旋转成份矩阵a

成份
12
总人口.016.994
中等学校平均校龄.941-.009
总雇员数.137.980
专业服务项目数.825.447
中等房价.968-.006
提取方法 :主成份。 

旋转法 :具有 Kaiser 标准化的正交旋转法。

a. 旋转在 3 次迭代后收敛。

    因子载荷即各因子对各变量的影响程度,由上表可得出因子与因子载荷表示的变量表达式:

+

+

+

+

+

    第一主因子对中等学校平均校龄,专业服务项目,中等房价有绝对值较大的载荷(代表一般社会福利-福利条件因子); 而第二主因子对总人口和总雇员数有较大的载荷(代表人口-人口因子).

2.3 因子得分

若要使用这些因子做其他研究,如自变量回归分析、聚类、判别、评价等,就要对公因子进行测度,即求出公因子的值。因此有SPSS因子分析输出因子得分矩阵如下:

表6: 成份得分系数矩阵

成份
12
总人口-.091.484
中等学校平均校龄.392-.096
总雇员数-.039.465
专业服务项目数.299.138
中等房价.403-.098

        由上表可以直接写出各公因子的表达式:

3.主成分分析

3.1 相关系数分析

由因子分析可以输出5个变量间的相关系数矩阵如下,可见总人口与总雇员数、中等房价与中等学校平均校龄等变量间相关性较强,存在信息上的重叠。

    表7: 相关矩阵

总人口中等学校平均校龄总雇员数专业服务项目数中等房价
相关总人口1.000.010.972.439.022
中等学校平均校龄.0101.000.154.691.863
总雇员数.972.1541.000.515.122
专业服务项目数.439.691.5151.000.778
中等房价.022.863.122.7781.000
3.2 主成分分析

    由因子分析可知,选取两个主成分就可以描述原变量的绝大部分信息,同时可以输出未旋转前的主成分系数矩阵如下表,说明了各主成分在个变量上的载荷,再分别除以相应主成分的特征值的平方根,从而得出各主成分的表达式,注意在表达式中各变量己经不是原始变量,而是标准化变量。

成份矩阵a

成分特征值
成份成份
1212
总人口.581.8062.8731.797
中等学校平均校龄.767-.545
总雇员数.672.726
专业服务项目数.932-.104
中等房价.791-.558

                  =

                 =

其中,  =1.797    

文档

因子分析与主成分分析

目录1.问题描述22.因子分析22.1数据基本分析22.2因子旋转32.3因子得分43.主成分分析53.1相关系数分析53.2主成分分析51.问题描述对美国洛杉矶12个人口调查区的5个经济学变量的数据进行主成分分析与因子分析,数据如下:表1编号总人口中等学校均龄总雇员数专业服务项目数中等房价1570012.82500270250002100010.96001010000334008.810001090004380013.61700140250005400012.8160014025000682
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top