统计分析与SPSS课后习题课后习题答案汇总(第五版)
因概率P值小于显著性水平(0.05),所以表明在控制了性别之后,阅读成绩对数学成绩有显著的线性影响。
8、采用二次曲线(略)
第十章练习题答案
1、采用欧氏距离,组间平均链锁法
利用凝聚状态表中的组间距离和对应的组数,回归散点图,得到碎石图。大约聚成4类
29 / 34
统计分析与SPSS课后习题课后习题答案汇总(第五版)
由图可知,北京自成一类,江苏、广东、上海、湖南、湖北聚成一类。其他略。 均值对比,依据聚类解,利用分类汇总,计算各个聚类变量的均值
方差分析结果:
不同组在各个聚类变量上的均值均存在显著差异。
2、数量级将对距离产生较大影响,并影响最终聚类结果。
3、会。如果所选变量之间存在较强的线性关系,能够相互替代,在计算距离时同类变量将重复“贡献”,占有较高权重,而使最终的聚类结果偏向该类变量。 4、K-Means聚类分析步骤:
确定聚类数目K--确定K个初始类中心点--根据距离最近原则进行分类--重新确定K个类中心点--判断是否已经满足终止条件。
是一个反复迭代的分类过程。在聚类过程中,样本所属的类会不断调整,直至达到最终稳定为止。
5、聚成3类较为恰当。
30 / 34
统计分析与SPSS课后习题课后习题答案汇总(第五版)
第十一章练习题答案
1、因子分析的主要步骤:
一、前提条件:要求原有变量之间存在较强的相关关系。二、因子提取。三、使因子具有命名解释性:使提取出的因子实际含义清晰。四、计算样本的因子得分。 2、“基本建设投资分析”因子分析 (1)
Correlation Matrix
国家预算内资金 国内贷款
Correlation
利用外资 自筹资金 其他投资
国家预算内资金
1.000 .458 .229 .331 .211 国内贷款
.458 1.000 .746 .744 .686 利用外资
.229 .746 1.000 .864 .776 自筹资金
.331 .744 .864 1.000 .928 其他投资
.211 .686 .776 .928 1.000
表一是原有变量的相关系数矩阵。由表可知,一些变量的相关系数都较高,呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy.
Approx. Chi-Square
Bartlett's Sphericity
Test
of
df Sig.
.706 119.614 10 .000
由表二可知,巴特利特球度检验统计量的观测值为119.614,相应的概率P-值接近0.如果显著性水平为0.05,由于概率P-值小于显著性水平α,则应拒绝原假设,认为相关系数矩阵与单位阵有显著差异,原有变量适合做因子分析。同时,KMO值为0.706,根据KMO度量标准可知原有变量可以进行因子分析。 Communalities 国家预算内资金 国内贷款 利用外资 自筹资金 其他投资 Initial Extraction 1.000 1.000 1.000 1.000 1.000 .196 .769 .820 .920 .821 Extraction Method: Principal Component Analysis.
由表三可知,利用外资、自筹资金、其他投资等变量的绝大部分信息(大于80%)可被因子解释,这些变量的信息丢失较少。但国家预算内资金这个变量的信息丢失较为严重(近
31 / 34
统计分析与SPSS课后习题课后习题答案汇总(第五版)
80%)。总的来说,本次因子提取的总体效果还不错。为了达到更好的效果,可以重新指定提取特征值的标准,指定提取2个因子。补充说明如下:
故由表四可知,第1个因子的特征值很高,对解释原有变量的贡献最大;第三个以后的因子特征值都较小,对解释原有变量的贡献很小,可以忽略,因此选取两个因子是合适的。
表五:重新提取因子后的公因子方差表
Communalities
国家预算内资金 国内贷款 利用外资 自筹资金 其他投资
Initial Extraction 1.000 1.000 1.000 1.000 1.000 .975 .795 .860 .937 .882 Extraction Method: Principal Component Analysis.
表五是指定提取2个特征值下的变量共同度数据。由第二列数据可知,此时所有变量的共同度均较高,各个变量的信息丢失都较少。因此,本次因子提取的总体效果比较理想。 Total Variance Explained Component Total 1 3.526 Initial Eigenvalues % of Variance Cumulative % 70.518 70.518 Extraction Sums of Squared Loadings Total 3.526 % of Variance Cumulative % 70.518 70.518 32 / 34