2012年高教社杯全国大学生数学建模竞赛A题全国一等奖论文 下载本文

得出相关系数矩阵为:

?r11?r21R??????rp1r12r22rp2r1p?r2p?? (11) ??rpp??因为R是实对称矩阵,所以只需计算上三角元素或下三角元素即可。 (即rij?rji)? 计算特征值与特征向量

首先解特征方程?I?R?0,通常用雅可比法(Jacobi)求出特征值

?i(i?1,2,?,p),并使其按大小顺序排列,即?????,???0;然后分别求

12p2出对应于特征值?i的特征向量ei(i?1,2,?,p)。这里要求ei=1,即?eij?1,其

j?1p中eij表示向量ei的第j个分量。 ? 计算主成分贡献率及累计贡献率

主成分Zi的贡献率为

?i??k?1p(i?1,2,?,p)

k累计贡献率为

????k?1k?1pik(i?1,2,?,p)k

一般取累计贡献率达85—95%的特征值?1,?2,?,?m所对应的第一、第二,…,第m(m≤p)个主成分。

9

? 计算主成分载荷

其计算公式为:

lij?p(zi,xj)? ?ieij(i,j?1,2,,p) (12)得到各主成分的载荷后,还可以按照(9)式进一步计算,得到各主成分的

得分。

其计算公式为:

?z11?z??21???zn1z12z22zn2z1m?z2m?? (13) ??znm?

Z利用Matlab软件的矩阵计算功能编程(附录二)实现主成分分析法的应用。根据运行结果(附录二)可知:贡献率越大的物质对葡萄的质量影响越大。影响葡萄质量的主成分主要有三种,分别是:固酸比、氨基酸、可溶性固形物,分位于第一、二、三位。根据第一、第二、第三主成分的得分(见附录二),由红地球葡萄分级标准得出27个样品葡萄酒的等级从而推断出葡萄的质量等级如(表5)

表5 红葡萄分级标准

特级 一级 ≥17.0 ≤0.48 ≥35.4 二级 ≥16.0 ≤0.50 ≥32.0 三级 ≥15.0 ≤0.53 ≥28.3 可溶性固形物 % ≥18.0 总酸量 % ≤0.46 固酸比值 ≥39.1 得出红葡萄酒的的分级结果(见表6): 表6 分级结果

特级 一级 二级 三级 红葡萄酒1.12.21.23.27 6.7.25 11.19.24 4.5.8.10.14.15.22 品种 白葡萄酒5.7.8.18.25 27.1.15.16 17.14.21.23 6.13.20 品种 由表可知:红葡萄酒中特级的是1、12、21、23、27,一级的是6、7、25,二级的是11、19、24,三级的是4、5、8、10、14、15、22;白葡萄酒中特级的是5、7、8、18、25,一级的是27、1、15、16,二级的是17、14、21、23,三级的是6、13、20.

5.3模型三的建立与求解 5.3.1模型三的建立

10

典型相关分析原理是预测两组变量之间相关程度的一种多元统计方法。本题研究的是酿酒葡萄与葡萄酒的理化性质之间的联系。因此,运用典型相关分析解决问题。由于葡萄的理化指标与葡萄酒的理化指标的数量都较大,所以本文只选取相对比较重要的葡萄与葡萄酒的的理化指标进行分析。

任意选取几组数据,利用MATLAB程序,做出两组变量之间的散点图,如图1。由图形可以看出该两组变量呈线性相关。

图1 两个变量之间的关系

记:X??x1,x2,x3,x4,x5,x6? ,Y??y1,y2,y3,y4,y5,y6? 即原始矩阵为:

?x11x12?x1py11y12?y1q??x?x?xyy?y22p21222q??21

??????xx?xyy?y?n2npn1n2nq??n1?其中样本容量为n=27(红葡萄酒)或28(白葡萄酒),附录中的数据用SPSS 软件计算得十二个变量之间的相关矩阵如下

R = ??R11?R21R12? ?R22? 11

其中R11,R22分别为酿酒葡萄和葡萄酒的理化指标的变量的相关矩阵,

R12?R21'为酿酒葡萄理化特性的变量和葡萄酒理化指标的相关系数。

计算矩阵

A?R?111R12R?122R21B?R?122R21R?111R12

?2和特征向量 特征值?i??R?1RR?1R12 ?(i):BD1?222111?(i)?D?1(D??(i)) ?(i)?D1?1(D1??(i)),?推出 ?22写出27个(28个)样本的典型变量:

?(1)Y???????(1)X,VU11?(2)Y???????(2)X,VU22 ?(P)Y???????(P)X,VUPP首先,检验第一对典型变量的相关系数,即

??0,H:???0 H0:?111它的似然比统计量为

p?2)(1???2).........(1???2)??2) ?1?(1???(1??12Pij?1则统计量

1Q1??[n?2?(p?q?1)]ln?1

2,查表得x2?,若Q1?x2?。则否定H0,认为第一对典型

给定显著性水平?变量相关,否则不相关。如果相关则依次逐个检验其余典型相关系数,直到某一

?k(k=2,?,个相关系数?p)检验为不显著为止,用SPSS得出的结果只能

说明两组变量之间的相关程度高,并不能准确的反映两者的关系。因此建立多元

回归模型来准确分析其中的关系。 5.3.2模型三的求解

对红葡萄与红葡萄酒的处理:利用问题二中在红葡萄的理化指标中筛选出来的六种理化指标花色苷、干物质含量、顺式白藜芦醇苷、山萘酚、谷氨酸、固酸比作为红葡萄理化指标的一组代表。然后,利用主成分分析法和SPSS软件对红葡萄酒的量化指标进行筛选,选出总酚、酒总黄酮、白藜芦醇、DPPH半抑制体积、色泽H(D65)、色泽C(D65)作为对葡萄酒理化指标的另一组代表。(见附录

12