2012年高教社杯全国大学生数学建模竞赛A题全国一等奖论文 下载本文

3.1)

用SPSS软件得出的结果只能说明两组变量之间的相关程度高,并不能准确的反映两者的关系。因此建立多元回归模型来准确分析其中的关系。 5.3.3模型三的检验

多元线性回归分析的模型为

??y=?0+?1x1+???+?mxm+ (14) ?2~N0,?????式中?0,?1,???,?m,?2都是与x1,x2,???,xm无关的未知参数,其中?0,?1,???,?m称为回归系数。

现得到n个独立观测数据?yi,xi1,???,xim?,i=1,???,n,n>m,由得由?14?得

??yi=?0+?1xi1++?mxim+i (15) ?2??i~N?0,??,i=1,,n记

?1x11X=????1xn1=?1x1m??y1??, Y=?? (16) ????xnm???yn??n?T,?=??0?1?m?

T式(16)可表示为

??Y=X?+ (17) ?2~N0,?E?n???其中En为n阶单位矩阵。 多元二项式回归分析模型为:

y=?0+?1x1+???+?mxm???jjxj2 (18)

j?1m式中?0,?1?,??,m?,?11,mm?都是与x1,x2,???,xm无关的未知参数,其中

?0,?1,???,?m,?11,?mm称为回归系数。

现有n个独立观测数据?yi,xi1,???,xim?,i=1,???,n,n>m,由得由(14)得

yi=?0+?1xi1+???+?mxim???jjxij2 (19)

j?1m记

13

?1x11?X=??1xn1?x1mxnmx112xn12x1m2??y1???? (20) Y=, ???2??xnm??yn??,?m,?11,,?mm?T?=??0,?1,

通过问题二本文确定了影响酿酒葡萄质量的因素有总氨酸、固酸比、总酚、

单宁、花色苷,以下分别以数字编号1~5表示。确定的葡萄酒的理化指标有单宁、总酚、酒总黄酮以下分别以数字编号1~4表示。利用经过筛选的数据建立模型如下(以白葡萄酒的理化指标对酿酒葡萄最重要因素为例):

??y=?0+?1x1+???+?4x4+ (21) ?2~N0,?????现有25个独立观测数据?yi,xi1,???,xi4?,i=1,???,25,由得由(14)得

??yi=?0+?1xi1++?4xi4+i ?2??i~N?0,??,i=1,,25记

?1x11X=????1x251=?125x14??y1??, Y=?? (22) ????x254???y25???T,?=??0?1?4?,xij表示第i种葡萄的第j种因素的值。yiT表示第i种葡萄最重要因素值。

?22?式表为

??Y=X?+ ? (23) 2??~N?0,?E25?其中E25为25阶单位矩阵。

将题目中的数据代入上述公式,经过Matlab求解得:

y1?0.0193?0.556x1?0.0573x3?0.0301x4

利用同样的方法求得y2,y3,y4,y5的表达式如下:

y2?0.0164?0.9294x1?0.5377x2?0.0659x3?0.1579x4;y3?0.0277?11.2907x1?11.5177x2?0.0486x3?0.0423x4;y4?0.0013?0.7596x1?0.1667x2?0.0019x3?0.0039x4; y5?0.0165?2.1468x1?2.0311x2?0.3416x3?0.0106x4; 14

利用28组数据建立多元二次回归模型如下(以白葡萄酒的理化指标对酿酒葡萄最重要因素为例):

y=?0+?1x1+???+?4x4???jjxj2 (24)

j?14现有n个独立观测数据?yi,xi1,???,xi4?,i=1,???,25,由得由(14)得

yi=?0+?1xi1+???+?4xi4???jjxij2 (25)

j?14记

?1x11?X=??1x251?x14x25mx112x2512x142??y1????(26) Y=, ???2??x254??y25??,?44?T?=??0,?1,,?4,?11,

将28组数据代入上述模型利用Matlab求解结果如下:

Y1?0.019?26.3259x1?26.9798x2?0.2487x3?0.0365x4?557.6351x?559.5212x2?0.822x3?0.3655x4通过Matlab拟合得到的多元线性回归方程(以y1为例)为:

21222

y1?0.0193?0.556x1?0.0573x3?0.0301x4

二次曲线回归模型:

Y1???1X1??2X12??3X13

通过Matlab拟合得到回归方程:

Y1?0.019?26.3259x1?26.9798x2?0.2487x3?0.0365x4?557.6351x?559.5212x2?0.822x3?0.3655x421222

对于y1由Matlab程序求解得出残差S12?0.0001;对于Y1由Matlab求解得

S22?0.0064,则线性回归模型优于二次回归模型。

综合比较两残差的平方和的大小可以确定一次回归模型较为理想,因此,本文选取多元线性回归模型描述酿酒葡萄与葡萄酒的理化指标之间的联系,其结果如下:

15

y1?0.0193?0.556x1?0.0573x3?0.0301x4;y2?0.0164?0.9294x1?0.5377x2?0.0659x3?0.1579x4;y3?0.0277?11.2907x1?11.5177x2?0.0486x3?0.0423x4;y4?0.0013?0.7596x1?0.1667x2?0.0019x3?0.0039x4;y5?0.0165?2.1468x1?2.0311x2?0.3416x3?0.0106x4;

5.4模型四的建立与求解 5.4.1模型的建立

若要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,则需先求得它们之间的相关性。灰色系统理论[1]提出了对各子系统(或因素)之间的数值关系。本题运用灰色关联度分析对系统二者的关系进行度量。并运用结论分析葡萄和葡萄酒的理化指标对葡萄酒的质量的影响。

灰色综合评价主要是依据以下模型:

R?Y?W

式中R为M个被评价对象的综合评价结果向量;W为N个评价指标的权重向量;E为各指标的评判矩阵。

?i(k)为第个i被评价对象的第k个指标与第k个最优指标的关联系数。根据

R的数值,进行排序。

设F?[j1,j2,jn],式中jk为第k个指标的最优值。此最优序列的每个指标

值可以是诸评价对象的最优值,也可以是评估者公认的最优值。

i式中jk为第i个葡萄样品第k个指标的原始数值。

由于评判指标间通常是有不同的量纲和数量级,故不能直接进行比较,为了保证结果的可靠性,因此需要对原始指标进行规范处理。设第个k指标的变化区间为[jk1,jk2],jk1为第k个指标在所有被评价对象中的最小值,jk2为第k个指标在所有被评价对象中的最大值,则可以用下式将上式中的原始数值变成无量纲值

iCk?(0,1)。

ijk?jk1,i?1,2,?m,k?1,2,?,n C?ijk2?jkik**根据灰色系统理论,将{C*}?[C1*,C2,?,Cn]作为参考数列,将ii{C}?[C1i,C2,?,Cn]作为被比较数列,则用关联分析法分别求得第i个被评价对

象的第k个指标与第k个指标最优指标的关联系数,即

**minminCk?Cki??maxmaxCk?Ckiikik ?(ik)?*i*iCk?Ck??maxmaxCk?Ckik上式中:??(0,1),一般取??0.5。

16