费用的置信区间。 ?
3. 设有某企业近年来总成本与产量的资料,见下表。 年 份 1993 1994 1995 1996 1997 1998 总成本Y 32900 52400 42400 62900 74100 100000 产量X 400 600 500 700 800 1000 年 份 1999 2000 2001 2002 2003 2004 总成本Y 86300 139000 115700 154800 178700 203100 产量X 900 1200 1100 1300 1400 1500 23Y????x??x??x??t t01t2t3t(1)试拟合以下总成本函数:
(2)试根据以上结果推算总产量为1350时的单位产品平均成本。 四、操作题
Ex9_1中存放着在一项身高和体重的关系的研究中抽查的12个人的身高(单位: 厘米)和体重(单位: 公斤)的数据, 以前的研究表明, 人的体重和身高之间存在线性关系。
(1) 计算体重和身高间的Pearson相关系数r为( )。
A. 0.9922 B. 0.8389 C. 0.6442 D. -0.9922
(2) 由第(1)题计算的Pearson相关系数判断两者间的相关程度和相关方向为( )。 A. 高度负相关 B. 中度负相关 C. 高度正相关 D. 中度正相关
(3) 假如要建立体重(因变量)对身高(自变量)的线性回归模型,求得其经验回归直线为( )。 ??118.96?1.08x ???118.96?1.08x B. yA. y???118.96?1.08x D. y??118.96?1.08x C. y(4) 检验回归系数是否为0即
H0:?1?0, 则( ) 。 (显著性水平??0.05)
A. t?-1.7196, 回归系数?1?0 B. t?2.6633, 回归系数?1?0 C. t?2.6633, 回归系数?1?0 D. t?-1.7196, 回归系数?1?0
(5)该线性回归模型的可决系数为( )。
A. 0.9900 B. 0.8326 C. 0.6667 D. 0.4150
29
第十章 多元统计分析
习 题
一、单选题
1. 第k个主成分yk的系数向量是( )。(知识点10.1 主成分分析,答案:B) A.第k个特征根
B.第k个特征根所对应的特征向量 C.第k个特征根所对应的方差贡献率
D.第k个特征根所对应的累计方差贡献率
?a11?a212.p个变量,其因子载荷矩阵A???......??ap1?......a1q?a22......a2q??,变量共同度是( )。(知识点..................??ap2......apq??a1210.2 因子分析,答案:B)
A.各行元素之和 B.各行元素平方和 C.各列元素之和 D.各列元素平方和
?0??10?
?。选择最长距离法作为类与3.已知ABCD四个样本点,计算其距离矩阵为:?
?240???3520??
类间距离的测度方法,首先( )聚为一类。(知识点10.3 聚类分析,答案:A)
A.A和B B.B和D C.A和C D.C和D
4.距离判别时,待判样本x计算出与各类的距离分别为:D(x,1)?637,D(x,2)?624,则( )。(知识点10.4 判别分析,答案:B)
A.x归入第一类 B.x归入第二类 C.x还需进一步判断 D.资料不足,无法判断
二、多选题
1.有关主成分的方差,下述表达正确的是( )。(知识点10.1 主成分分析,答案:ABCE )
A.主成分的方差矩阵是对角矩阵
B.第k个主成分的方差为对应的特征根 C.主成分的总方差等于原变量的总方差
D.主成分的方差等于第k个主成分与第j个变量样本间的相关系数 E.任意两个主成分的方差是不相关的。
2.因子分析中,第j个因子的方差贡献率( )。(知识点10.2 因子分析,答案:BE ) A.是因子载荷矩阵中各列元素的平方和
30
22B.是因子载荷矩阵中各列元素的平方和占p个变量的总方差之比 C.是因子载荷矩阵中各行元素的平方和占p个变量的总方差之比 D.是说明变量所包含的原始信息被公共因子所解释的部分大小的 E.是衡量各个公共因子相对重要程度的一个指标。 3.对样本进行聚类,通常采用的相似性统计量有( )。(知识点3 聚类分析,答案:ABE ) A.绝对距离 B.欧氏距离 C.夹角余弦 D.相关系数 E.切比雪夫距离
4.下列表述正确的是( )。(知识点10.4 判别分析,答案:BCE)
A.在费歇尔判别中,计算待判样本与各类的距离,判断待判样本与哪一类最近,就判它属于哪一类。
B. 在距离判别中,计算待判样本与各类的距离,判断待判样本与哪一类最近,就判它属于哪一类。
C. 贝叶斯判别中,对于待判样本x,如果在所有的P(Gk/x)中P(Gh/x)是最大的,则判定x属于第h总体。
D. 判别规则只能是统计性的
E. 判别规则可以是统计性的,也可以是确定性的。
三、计算题
1. 下面是8个学生两门课程的成绩表: 英语x1 数学x2 1 100 65 2 90 85 3 70 70 4 70 90 5 85 85 6 55 45 7 55 55 8 45 65 (1)求出两个特征根及其对应的单位特征向量; (2)求出主成分,并写出表达式;
(3)求出主成分的贡献率,并解释主成分的实际意义; (4)求出两个主成分的样本协方差矩阵;
(5)第1个样本主成分与第2个变量样本之间的相关系数为多少
2. 已知x=(x1,x2,x3,x4,x5)的样本相关系数矩阵R如下,计算出因子载荷矩阵A的第一列元素。
?1??0.810?1??? R??0.4510.6421??0.9020.8860.7201????0.7250.5220.8820.9341??
3. 某校从高中二年级女生中随机抽取16名,测得身高和体重数据如下表: 序号
身高(cm) 体重(kg) 序号 身高(cm) 体重(kg) 31
1 2 3 4 5 6 7 8 160 159 160 169 162 165 165 154 49 46 41 49 50 48 52 43 9 10 11 12 13 14 15 16 160 160 157 163 161 158 159 161 45 44 43 50 51 45 48 48 试根据不同的类与类之间距离的测度方法进行聚类(分类统计量采用欧氏距离),并画出聚类图。
四、操作题
1. Ex10_1数据库中是纽约证券交易市场五支股票的星期收益率,共100周的数据。五支股票分别为Allied Chemical, Du Pont, Union Carbide, Exxon, Texaco. 为了描述的方便,我们将五支股票分别定义为变量X1,X2,X3,X4,X5,主成分用Yi表示,因子用Fj表示。
(1)第一个主成分的表达式为:( )
A. Y1=0.4636X1-0.2411X2+0.6126X3-0.3821X4-0.4535X5 B. Y1=2.8562X1+0.8090X2+0.5401X3+0.4516X4+0.343X5 C. Y1=0.4636X1+0.4571X2+0.47X3+0.4217X4+0.4213X5 D. Y1=0.8635X1+0.8236X2+0.7469X3+0.8882X4+0.8832X5 答案:C (2分)
(2)第一个主成分与Allied Chemical(X1)变量间的相关系数为( )。 A.2.8562 B. 0.4636 C.0.8635 D.0.7834 答案:D (2分)
(3)主成分分析中,提取三个主成分能说明原始信息量的( )。 答案:A A. 84.107% B. 90.209% C.90.107% D.90.834%
(4)因子分析后,下列表达式正确的是( )。答案:B (2分) A. F1=0.7834X1+0.7725X2+0.7943X3+0.7126X4+0.7120X5 B. X1=0.7834F1-0.2169F2-0.4502F3+0.2568F4
C. F1=0.4636X1+0.4571X2+0.47X3+0.4217X4+0.4213X5 D. X1=0.4636F1-0.2411F2+0.6126F3-0.3821F4-0.4535F5
(5)对五个变量进行聚类,数据经Z分数法标准化,采用最短距离聚类法, 欧氏距离平方测度距离,在距离为182.2处可聚为( )类。答案:C (2分)
A.1 B.2 C.3 D.4
2. Ex10_2数据库,某公司正在评估销售人员的能力,该公司随机抽选了40名销售人员,评估他们三项指标:销售量增长率(X1),利润率(X2),新客户销售量(X3)。四十个人还进行了四项测试:创造能力测试(X4),商业能力测试(X5),抽象能力测试(X6)及数学能力测试(x7)。计算过程
32