多元统计分析模拟考题及答案 下载本文

一、判断题

( 对 )1X?(X1,X2,,Xp)?的协差阵一定是对称的半正定阵

( 对 )2标准化随机向量的协差阵与原变量的相关系数阵相同。 ( 对)3典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系

的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。 ( 对 )4多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。

( 错)5X?(X1,X2,?,Xp)?~Np(?,?),X,S分别是样本均值和样本离差阵,则X,S分别是?,?的无偏估计。 n( 对)6X?(X1,X2,?,Xp)?~Np(?,?),X作为样本均值?的估计,是

无偏的、有效的、一致的。

( 错)7 因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化

( 对)8因子载荷阵A?(aij)中的aij表示第i个变量在第j个公因子上的相对重要性。

( 对 )9 判别分析中,若两个总体的协差阵相等,则Fisher判别与距离判别等价。

(对)10距离判别法要求两总体分布的协差阵相等,Fisher判别法对总体的分布无特定的要求。

二、填空题

1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、样本相关系数矩阵. 2、设?是总体X?(X1,位正交化特征向量

,Xm)的协方差阵,?的特征根?i(i?1,,m)与相应的单

?i?(ai1,ai2,,aim),则第一主成分的表达式是

y1?a11X1?a12X2??a1mXm,方差为?1。

3设?是总体X?(X1,X2,X3,X4)的协方差阵,?的特征根和标准正交特征向量分别为:?1?2.920U1'?(0.1485,?0.5735,?0.5577,?0.5814)

'?2?1.024U2?(0.9544,?0.0984,0.2695,0.0824) '?3?0.049U3?(0.2516,0.7733,?0.5589,?0.1624)

'?4?0.007U4?(?0.0612,0.2519,0.5513,?0.7930),则其第二个主成分的表达式是

- 1 -

y2?0.9544X1?0.0984X2?0.2695X3?0.0824X4,方差为1.024

4. 若X(?)~Np(?,?),(??1,2,?,n)且相互独立,则样本均值向量X服

从的分布是N?p(?,n).

5.设XiNp(?,?),i?1,2,,16,X和A分别是正态总体的样本均值和样本离差

阵,则T2?15[4(X??)]?A?1[4(X??)]服从 T2(15,p)或15p16?pF(p,n?p) 106设XiN3(?,?),i?1,2,,10,则W??(Xi??)(Xi??)?服从W3(10,?)

i?1?4?43?7.设随机向量X?(X1,X2,X3)?,且协差阵?????49?2???,则其相关矩阵?3?216???R=

?1?23??38????21?1?? ?36????3?8?161???8. 设X?(XN其中??(??11,X2)2(?,?),,1,?2),???2?????1?,则?Cov(X1?X,2X?1X)?20

9设X,Y是来自均值向量为?,协差阵为?的总体G的两个样品,则X,Y间的马氏平方距离d2(X,Y)?(X?Y)???1(X?Y)

10设X,Y是来自均值向量为?,协差阵为?的总体G的两个样品,则X与总体G的马氏平方距离d2(X,G)=(X??)???1(X??)

11设随机向量X?(X1,X2,X3)?的相关系数矩阵通过因子分析分解为

??1?12??33???0.9340?R??1??310??????0.934?0.4170.835???0.128?????0.4170.894????00.8940.447???0.027?2??0.8350.447????301????- 2 -

??0.103??? 则X1的共性方差h12? 0.9342 =0.872 ,其统计意义是:描述了全部公因子对变量X1的总方差所作的贡献,称为变量X1的共同度,反映了公共因子对变量X1的影响程度。

2标准化变量X1的方差为1,公因子f1对X的贡献g1?0.9342+0.4172+0.8352=1.743 12. 对应分析是将 Q型因子分析 和 R型因子分析 结合起来进行的统计分析方法

13 典型相关分析是研究两组变量间 相关关系 的一种多元统计方法

14. 聚类分析中,Q型聚类是指对 样本 进行聚类,R型聚类是指对 指标 进行聚类。

15 Spss for windows中主成分分析由Data Reduction->Factor Analysis 过程实现。

16 设Uk,Vk是第k对典型变量则 D(Uk)?1,D(Vk)?1Cov(Ui,Uj)?0,??i?0?Cov(Ui,Vj)??0?0?(k?1,2,,r)

Cov(Vi,Vj)?0(i?j) (i?j,i?1,2,(i?j)(j?r),r)

17. 在多维标度分析中,当D是欧几里得距离阵时,X是D的一个构图 三、简答题(答案见平时习题)

1 简述多元统计的主要内容与方法(10分)

可对比一元统计列出多元统计的主要内容与方法 (从随机变量及其分布、数字特征、四大分布(正态分布密度(1分)、?2(n)与威沙特分布Wp(n,?)(1分)、t分布与HotelingT2分布(1分)、F分布与威尔克斯分布?(p,n1,n2)(1分))、抽样分布定理、参数估计和假设检验、统计方法(2分)

2. 请阐述距离判别法、贝叶斯判别法和费希尔判别法的基本思想和方法,比较其异同

3请阐述系统聚类法、K均值聚类法、有序样品聚类法的基本思想和方法,比较其异同

4请阐述主成分分析和因子分析的基本思想、方法步骤和应用,比较其异同 5请阐述相应分析、多维标度法、典型相关分析和多变量的可视化分析的基本思想和应用

四、计算题

1设三维随机向量XN3(?,2I3),已知

1?00??2??0?.?5?????0I,?01A,3???0????0.5???0???01????0- 3 -

1?0?.51?d?,Y?AXd?,求的分布 ???00.52???解:正态分布的线性组合仍为正态,故只需求

?1??1??2?E(Y)?E(AX?d)?AEX?d???????????1??2??1? ?0.5?0.5??1?21????3?1?DY?D(AX?d)?ADXA????10???????10?1?11???0.5?0.5?????所以Y另解:

N3(E(Y),D(Y))

?0.5X1?X2?0.5X3?1?Y?AX?d????0.5X?0.5X?213??E(0.5X1?X2?0.5X3?1)?2E(?0.5X1?0.5X3?2)?1D(0.5X1?X2?0.5X3?1)?3D(?0.5X1?0.5X3?2)?1COV(0.5X1?X2?0.5X3?1,?0.5X1?0.5X3?2)??1111??2??????3?,???132?,求N3(?,?),已知?????1??122?????故YN3(E(Y),D(Y))

2. 设三维随机向量X Y?3X1?2X2?X的分布3解:正态分布的任意线性组合仍正态,故Y的分布是一维正态分布,只需求

E(Y)?3E(X1)?2E(X2)?E(X3)?13D(Y)?32E(X1)?22E(X2)?E(X3)?2Cov(3X1,2X2)?2Cov(3X1,X3)?2Cov(X3,2X2)?9故YN(13,9)

,从中分别抽取样本计算得到

3设有两个二元总体

,

,

假设,试用距离判别法建立判别函数

和判别规则。 样品X=(6,0)’应属于哪个总体? 解:

=

=

, =

=

- 4 -

即样品X属于总体

?2??4??11?4设已知有两个正态总体G1,G2,且?1???,?2???,?1??2?????,而其

?6??2??19?先验概率分别为q1?q2?0.5,误判的代价L(2|1)?e4,L(1|2)?e,试用贝叶斯判别法确定样本X???属于哪个总体?

?3??5?解:由Bayes判别知,W(x)?f1(x)?exp[(x??)???1(?1??2)] f2(x)其中

????????

??2?1?9?1??1????,?1??2???8??11??4???(?1??2)???????????2422611??2??4???3?d?q2C(1|2)?e3

q1C(2|1)?x??3?W(x)?W?1??W???d

?5??x2?故X???属于G2总体

?3??5?5表1是根据某超市对不同品牌同类产品按畅销(1)、平销(2)和滞销(3)的数据,

利用SPSS得到的Bayes判别函数系数表,请据此建立贝叶斯判别函数,并说明如何判断新样品(x1,x2,x3)属于哪类?

Classification Function Coefficients 1 group 2 3 - 5 -

x1 x2 x3 (Constant-11.689 -10.707 12.297 16.761 13.361 17.086 -2.194 4.960 6.447 -81.843 -94.536 -17.449 ) Fisher's linear discriminant functions 表1 Bayes判别函数系数 解:根据判别分析的结果建立Bayes判别函数:

Bayes判别函数的系数见表4.1。表中每一列表示样本判入相应类的Bayes判别函数系数。由此可建立判别函数如下:

Group1: Y1??81.843?11.689X1?12.297X2?16.761X3 Group2: Y2??94.536?10.707X1?13.361X2?17.086X3 Group3: Y3??17.449?2.194X1?4.960X2?6.447X3

将新样品的自变量值代入上述三个Bayes判别函数,得到三个函数值。比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一类。

6. 对某数据资料进行因子分析,因子分析是从相关系数阵出发进行的,前两个特征根

为,

?1?2.920U1'?(0.1485,?0.5735,?0.5577,?0.5814)?1?2.920U1'?(0.1485,?0.5735,?0.5577,?0.5814)

(1) 取公因子个数为2,求因子载荷阵

(2) 用F1F2表示选取的公因子,?1,?2为特殊因子,写出因子模型,说明因子载荷

阵中元素aij的统计意义

7在一项对杨树的形状研究中,测定了20株杨树树叶,每个叶片测定了四个变量

X1,X2,X3,X4分别代表叶长,叶子2/3处宽,1/3处宽,1/2处宽,这四个变量的相

关系数矩阵的特征根和标准正交特征向量分别为:

?1?2.920U1'?(0.1485,?0.5735,?0.5577,?0.5814)

'?2?1.024U2?(0.9544,?0.0984,0.2695,0.0824)

- 6 -

'?3?0.049U3?(0.2516,0.7733,?0.5589,?0.1624) '?4?0.007U4?(?0.0612,0.2519,0.5513,?0.7930)

若按一般性原则选取主成分个数,请写出主成分表达式,并计算每个主成分的方差贡献率

解:选取主成分的一般原则是特征值大于1或累积贡献率达到80%以上。据题选取两个主成分,其表达式和贡献率分别是:

y1?0.1485X1?0.5735X2?0.5577X3?0.5814X4,贡献率为?1?2.920 y2?0.9544X1?0.0984X2?0.2695X3?0.0824X4,贡献率为?2?1.024

8下表是进行因子分析的结果,试根据表中信息写出每个原始变量的因子表达式,并分析是否需要对因子载荷旋转。

Component Matrix

X1 X2 X3 X4 X5 X6 X7 X8

Component 1 .969 .911 .847 .941 .899 -.313 -.666 .575

2

-1.084E-02 .321 -.120 .281 .215 .839 6.280E-02 -.580

3

.205

-.102

.323

-2.693E-02

-1.963E-02

.305

.679

.367

Extraction Method: Principal Component Analysis.

a 3 components extracted.

解:由表

X1 X2 X3 X4 X5 X6 X7 X8

F1 .969 .911 .847 .941 .899 -.313 -.666 .575 .969F1

F2 -1.084E-02 .321 -.120 .281 .215 .839 6.280E-02 -.580

-1.084E-02F2+

X1=

F3

.205

-.102

.323

-2.693E-02

-1.963E-02

.305

.679

.367 .205 F3

可以不做因子旋转,因为载荷系数基本处于两极分化状态,第一个公因子在指标X1 ,X2,X3,X4,X5,X7,X8有较大载荷,F2只在X6和X8上有较大载荷,F3只在X7上有较大载荷。

- 7 -