上表显示了因子载荷矩阵,是因子分析的核心内容。根据该表可以写出本案例的因子分析模型: x1=0.746f1+0.489f2 x2=0.796f1+0.372f2 x3=0.709f1-0.597f2 x4=0.911f1+0.389f2 x5=-0.234f1+0.963f2 x6=-0.177f1+0.972f2 x7=-0.886f1+0.219f2
x1,x2,x4,x7在第一个因子上有较高的载荷,第一个因子主要解释了这几个变量,x3,x5,x6在第二个因子上有较高的载荷,第二个因子主要解释了这几个
变量。与旋转前相比,因子含义比较清晰。
分析:上表显示了两因子的协方差矩阵。可以看出,两因子没有线性相关性,实现了因子的设计目标。
Component Plot in Rotated SpaceX6X51.0X70.5Component 2X1X40.0X2-0.5X3-1.0-1.0-0.50.00.51.0Component 1
由上图可以直观的看出,x4和x5比较靠近两个因子坐标抽,表明如果分别用第一个因子刻画x4,用第二个因子刻画x5,信息丢失较少,效果较好。单如果用一个因子分别刻画其他变量,则效果不是很理想。
Component Score Coefficient MatrixComponent12.270.075.268.031.110-.277.301.023.070.343.087.339-.210.173X1X2X3X4X5X6X7Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. 由上表可以写出以下因子得分函数:
F1=0.270x1+0.268x2+0.110x3+0.301x4+0.070x5+0.087x6-0.210x7 F2=0.075x1+0.031x2-0.277x3+0.023x4+0.343x5+0.339x6+0.173x7
可见计算两个因子得分变量的变量值时,x4和x5的权重较高,但方向恰好相反,这与因子的实际含义是相吻合的。另外,因子得分的均值为0,标准差为1.正值表示高于平均水平,负值表示低于平均水平。
实验五小结:
因子分析以最少的信息丢失为前提,将众多的原有变量综合成较少的几个综合指标,名为因子。明确因子的重要程度以及因子的分析效果,通过以下因素:因子载荷,变量共同度和因子的方差贡献。因子分析的基本步骤为:(1)因子分析的前提条件(2)因子提取(3)使因子更具有命名可解释性(4)计算样本因子得分 熟悉掌握因子分析,可以将繁琐的因素简单化,便于问题的分析。
实验六 聚类分析
内容:
请根据下列各省份的数据对我国汽车市场进行分类并分析每一类汽车市场的特
点。