
1.判别法的种类:距离判别分析、Fisher判别分析、Bayes判别分析。
2.降维的方法:主成分分析法、因子分析法。
3.若X~NP(µ,∑),则EX=µ, DX=∑。
4.标度法:在低维空间中展示“距离”数据结构的多元分析技术。
5.相应分析:指对两个或多个定性变量(因素)的多种水平进行相应性研究。
6.P27 2.10
设是来自的简单随机样本,,
(1)已知且,求和的估计。
(2)已知求和的估计。
解:(1),
(2)
解之,得
,
7.P38 3.1
3.1 试述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤。
其基本思想和步骤均可归纳为:
答:
第一,提出待检验的假设和H1;
第二,给出检验的统计量及其服从的分布;
第三,给定检验水平,查统计量的分布表,确定相应的临界
值,从而得到否定域;
第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。
均值向量的检验:
统计量 拒绝域
均值向量的检验:
在单一变量中
当已知
当未知
(作为的估计量)
一个正态总体
协差阵已知
协差阵未知
()
两个正态总体
有共同已知协差阵
有共同未知协差阵
(其中)
协差阵不等
协差阵不等
多个正态总体
单因素方差
多因素方差
协差阵的检验
检验
检验
统计量
8.P66 例5.1
9.P90 5.2
5.2 试述系统聚类的基本思想。
答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。
10.P107 6.6
6.6 已知X=()’的协差阵为 试进行主成分分析。
解:=0
计算得
当时,
同理,计算得
时,
易知相互正交
单位化向量得,
,
综上所述,
第一主成分为
第二主成分为
第三主成分为
11.P128 7.1
7.1 试述因子分析与主成分分析的联系与区别。
答:因子分析与主成分分析的联系是:两种分析方法都是一种降维、简化数据的技术。两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。
因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。
12.P170 9.1
9.1 什么是典型相关分析?简述其基本思想。
答: 典型相关分析是研究两组变量之间相关关系的一种多元统计方法。用于揭示两组变量之间的内在联系。典型相关分析的目的是识别并量化两组变量之间的联系。将两组变量相关关系的分析转化为一组变量的线性组合与另一组变量线性组合之间的相关关系。
基本思想:
(1)在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。即:
若设、是两组相互关联的随机变量,分别在两组变量中选取若干有代表性的综合变量Ui、Vi,使是原变量的线性组合。
在的条件下,使得达到最大。
(2)选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对。
(3)如此继续下去,直到两组变量之间的相关性被提取完毕为此。
