
多元统计分析模拟试
题(卷)
多元统计分析模拟试题(两套:每套含填空、判断各⼆⼗道)
A卷
1)判别分析常⽤的判别⽅法有距离判别法、贝叶斯判别法、费歇判别法、逐
步判别法。
2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的分类。
3)主成分分析中可以利⽤协⽅差矩阵和相关矩阵求解主成分。
4)因⼦分析中对于因⼦载荷的求解最常⽤的⽅法是主成分法、主轴因⼦法、
极⼤似然法
5)聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析
6)分组数据的Logistic回归存在异⽅差性,需要采⽤加权最⼩⼆乘估计
7)误差项的路径系数可由多元回归的决定系数算出,他们之间的关系为
=
8)最短距离法适⽤于条形的类,最长距离法适⽤于椭圆形的类。
9)主成分分析是利⽤降维的思想,在损失很少的信息前提下,把多个指标转
化为⼏个综合指标的多元统计⽅法。
10)在进⾏主成分分析时,我们认为所取的m(m
成分的累积贡献率达到85%以上⽐较合适。
11)聚类分析的⽬的在于使类内对象的同质性最⼤化和类间对象的异质性最⼤
化
12)是随机变量,并且有,那么服从(卡⽅)分布。
13)在对数线性模型中,要先将概率取对数,再分解处理,公式:
14)将每个原始变量分解为两部分因素,⼀部分是由所有变量共同具有的少数
⼏个公共因⼦组成的,另⼀部分是每个变量独⾃具有的因素,即特殊因⼦15)判别分析的最基本要求是分组类型在两组之上,每组案例的规模必须⾄少
⼀个以上,解释变量必须是可测量的
16)当被解释变量是属性变量⽽解释变量是度量变量时判别分析是合适的统计
分析⽅法
17)多元正态分布是⼀元正态分布的推⼴
18)多元分析的主要理论都是建⽴在多元正态总体基础上的,多元正态分布是
多元分析的基础
19)因⼦分析中,把变量表⽰成各因⼦的线性组合,⽽主成分分析中,把主成分表⽰成各变量的线性组合。
20)统计距离包括欧⽒距离和马⽒距离两类
1)因⼦负荷量是指因⼦结构中原始变量与因⼦分析时抽取出的公共因⼦的相
关程度。(√)(p147)
2)主成分分析是将原来较少的指标扩充为多个新的综合指标的多元统计⽅
法。(×)(p24)
3)判别分析其被解释变量为属性变量,解释变量是度量变量。(√)(p90)
4)Logistic回归对于⾃变量有要求,度量变量或者⾮度量变量都不可以进⾏
回归。(×) (p220)
5)在系统聚类过程中,聚合系数越⼤,合并的两类差异越⼩。(×) (P59)
6)spss只能对单变量进⾏正态性检验。(√)
7)Logistic回归中的估计参数(反应优势⽐率的变化,如果
是正的,它的反对数值(指数)⼀定⼩于1。(228)
8)密度函数可以是负的。(×) (p3)
9)计算典型函数推导的典型权重有较⼩的不稳定性。(×)(p205)
10)10、对应分析可以⽤图形的⽅式提⽰变量之间的关系,同时也可以给出具
体的统计量来度量这种相关关系,使研究者在作⽤对应分析时得到主观性
较强的结论。(×)(p179)11)多元检验具有概括和全⾯考察的特点,容易发现各指标之间的关系和差异。(×)p25
12)名义尺度的指标⽤⼀些类来表⽰,这些类之间有等级关系,但没有数量关
系。(×)p43
13) k-均值法是⼀种⾮谱系聚类法(√)p44
14)⼀般⽽⾔,不同聚类⽅法的结果不完全相同(√)p6
15)判别分析最基本要求是分组类型在两组以上且解释变量必须是可测量的
(√)p90
16)⾮谱系聚类法是把变量聚集成k个类的集合。(×)p
17)主成分的数⽬⼤⼤少于原始变量的数⽬。(√)p114
18) 因⼦分析只能⽤于研究变量之间的相关关系。(×)p143
19) 聚类分析中的分类⽅法中,系统聚类法和分解法相似(相反)。(×)P43
20) 聚类分析的⽬的就是把相似的研究对象归类。(√)P42
B 卷
⼀、填空题
1. 因⼦分析中因⼦载荷系数的统计意义是第i 个变量与第j 个公因⼦的相关系数;(
2. 类平均法的两种形式为组间联结法和组内联结法(P56)
3.设3~(,),i 1,2,10.i x x µ∑=则101
()~i i W x µ==-∑3(10)W ∑,(p5)
4.聚类分析根据实际的需要可能有两个⽅向,⼀是对样品,⼀是对指标聚类。(P43)
5. 模糊聚类分析⽅法中对原始数据进⾏变换,变换⽅法通常有标准化变换,极差变换,对数变换(p63)
(
)2
212121212
1
~(,),(,),(,),,1
X N X x x x x x x ρµµµµσ
ρ∑==∑=+-6、设其中则Cov(,)=0
7.⾮谱系聚类法是把样品聚集成K 个类的集合。(P)
8.因⼦分析的基本思想是根据相关性⼤⼩把原始变量分组,使得同组内的变量之间相关性较⾼,⽽不同组间的相关性较低。(P142)
9.两总体均值的⽐较问题也可分为两总体协⽅差阵相等与两总体协⽅差不相等两种情形。(P25)
10.因⼦旋转分为正交旋转和斜交旋转。(P150) 11. Q 型聚类是指对样品进⾏聚类,R 型聚类是指对指标(变量)进⾏聚类。(42页)
12. ⼀元回归的数学模型是: y =β0+β1x +ε,多元回归的数学模型是:_y =β0+β1x 1+β2x 2+ βp x p +ε_。 13. 变量的类型按尺度划分有间隔尺度、有序尺度、名义尺度_. (43页)
14. 判别分析是判别样品所属类型的⼀种统计⽅法,常⽤的判别⽅法有距离判别法、Fisher 判别法、Bayes 判别法、逐步判别法。(80页)
15若12112~(,),,~(,),0,p p p W n n W n A A ∑≥∑∑>,且A 1和A 2相互独⽴,则112~A
A A +12p n n Λ(,,)
. 。(19页)
16. 对应分析是将R 型因⼦分析和Q 型因⼦分析结合起来进⾏的统计分析⽅法。(170页)
17. 典型相关分析是研究两组变量之间相关分析的⼀种多元统计⽅法。(194页)
18. 判别分析适⽤于被解释变量是⾮度量变量的情形。
19. 主成分分析是利⽤降维的思想,在损失很少信息的前提下,把多个指标转化为⼏个综合指标的多元统计⽅法。(113页)
20.设i x ,1,2,16i =是来⾃多元正态总体(,)p N µ∑,X 和A 分别为
正态总体(,)p N µ∑的样本均值和样本离差阵,则
2115[4(X )][4(X )]T A µµ-'=--⼆、判断题
1、对于任何随机向量X='21)X ...,X X p ,(来说,其协⽅差阵∑都是对
称阵,同时总是⾮负定的。 ( T ) P5
2、能够体现各个变量在变差⼤⼩上的不同,以及有时存在的相关
性还要求距离与各变量所⽤的单位⽆关,这种距离是欧式距离。( F )P7
3、最长距离法中,选择最⼩的距离作为新类与其他类之间的距离,然后将类间距离最⼩的两类进⾏合并,⼀直合并到只有⼀类为⽌。 ( F )P55
4、当总体21G G 和为正态总体且协⽅差相等时,选⽤马⽒距离。
( T )P90
5、进⾏主成分分析的⽬的之⼀是减少变量的个数,所以⼀般不会去p 个主成分,⽽是取m(m
6、第k 个主成分k Y 与原始变量i X 的相关系数ρ(k Y ,i X )称为因⼦负荷量。( T )P120
7、 F=’),(m 21F ......,F F (m
(F )=0,协⽅差矩阵cov(F)=I,即向量F 的各分量不是相互独⽴的。(F )P145
8、每个典型函数都包括⼀对变量,通常⼀个代表⾃变量,另⼀个
代表因变量。(T )P202
9、分组数据的Logistic 回归不仅适⽤于⼤样本的分组数据,对⼩样本的未分组数据也适⽤。(F )P232
10、⼀个未知参数可以由显变量的协⽅差矩阵的⼀个或多个元素的代数函数来表达,就称这个为参数可识别。(T )P2
11、随机向量的协⽅差阵⼀定是对称的半正定阵。(T )P5
12、标准化随机变量的协⽅差阵与原变量的相关系数相同。( T )P5
13、对应分析反应的是列变量与⾏变量的交叉关系。( F )P170
14、若⼀个随机向量的任何边缘分布均为正态,则它是多元正态分布。(T )p10
15、特征函数描述空间的元素之间是否有关联,⽽⾪属度描述了元素之间的关联是多少。( T )p62
16、⾮谱系聚类法是把变量聚集成K 个类的集合。( F )p
17、在对因素A 和因素B 进⾏对应分析之前没有必要进⾏独⽴性检验。( T )p173
18、系统聚类法中的“离差平⽅和法”的基本思想来源于如果类分得正确,同类样品的离差平⽅和应该较⼩,类与类之间的离差平⽅和应该较⼤。(T)p57
19、距离判别法对总体的分布没有特定的要求。(T)p90
20、 Wilks统计量可以化成T2统计量但是化不成F统计量。(F)p18
