2012年高教社杯全国大学生数学建模竞赛A题全国一等奖论文 下载本文

葡萄酒的评价

摘要

本文主要对两组评酒员的评价结果及可信度、酿酒葡萄的分级、酿酒葡萄与葡萄酒的理化性质之间的联系和是否影响葡萄酒的质量进行分析及研究。 对于问题一,利用附件一中评酒员群体对红、白葡萄酒进行两次评分的数据,运用t检验模型,求出P值用于判定有无显著性差异。出于对结果的科学性考虑,建立了二值化可信度模型对评酒员的可信度进行定量描述。若可信度值

pi越大,

则说明评价结果越可信。通过比较第一、二组的P值,得出第一组的可信度更高些。

对于问题二,运用主成分分析法,选取葡萄酒样品中含有的一级指标物的数据,得出贡献率。再利用贡献率(贡献率越大对葡萄的质量影响越大)的大小,选出影响酿酒葡萄分级的主成分因素,并利用红地球葡萄的分级标准对酿酒葡萄进行分级。

对于问题三,首先利用主成分分析法和SPSS软件对红葡萄酒的量化指标进行筛选,选出总酚、酒总黄酮、白藜芦醇等6种物质作为对葡萄酒理化指标的一组样本。借用在问题二中筛选出来的花色苷、干物质含量、顺式白藜芦醇苷等六种红葡萄的理化指标作为另一组样本。然后利用上述两组数据,建立典型相关分析模型,求出葡萄酒理化指标和酿酒葡萄的相关系数,从而确定两者之间的关联度。最后建立二元回归模型进而求出两者之间的关系。

对于问题四,运用主成分分析降维的思想,运用灰色关联度模型,利用几组变量的数据,通过 MATLAB软件求得关联度,进而来反映两变量之间的线性关系。根据关联度的大小,考虑多方面的因素对葡萄酒的质量进行评价与论证。

关键词:t检验法、可信度模型、主成分分析法、多元回归模型 、灰色关联度

1

1 问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:

1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?

2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否 用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 附件1:葡萄酒品尝评分表(含4个表格)

附件2:葡萄和葡萄酒的理化指标(含2个表格) 附件3:葡萄和葡萄酒的芳香物质(含4个表格)

2 问题假设

1. 评酒员间的评价尺度、评价位置和评价方向相同

2. 二级指标里的因素对酿酒葡萄分级的影响不大,可忽略不计; 3. 题中给出的所有数据准确无误;

4、测试理化指标用的葡萄和相应酒样的酿酒葡萄是同一批;

5、附件2、3中的理化指标具有代表性,可以真实反映该品种葡萄和葡萄酒的物理化学特性;

3 符号说明

符号 x1,x2 ss1,ss2 表示的意义 均值 均离差平方和 处理的重复次数 统计量 自由度 n n1,n2 df Sx-x标准误差 可信度值 评酒员对评价对象的综合评价结果 12pi di(A)

2

p1i p0i 评酒员Ei的通过正确率 评酒员Ei不通过正确率 贡献率 主成分负荷 主成分的得分 原假设 第i样品第k个指标的值 关联度系数 关联度 分辨系数 Z lij iZ A0 xi(k) ? iRi ? 4 问题分析

4.1问题一的分析

针对问题一,若要评论两组评酒员的评价结果有无显著性差异,则需在评酒员间的评价尺度、评价位置和评价方向一致的前提下,利用附件一中的数据,考虑到每组只有十位评委,属于小样本比较,而且每组样本数量相等,运用t检验法,求出P值与t的临界值比较,得出两组评酒员对红、白葡萄酒的评价结果是否有显著性差异。基于结果的准确性,本文建立了二值化可信度模型对评酒员的可信度进行定量描述。若可信度值Pi越大,则说明评价结果越可信。

4.2问题二的分析

针对问题二,若要根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,则需找出酿酒葡萄的理化指标与葡萄酒质量之间的联系。由于附件二中的数据庞大,经查阅资料,本文最终运用一级指标的因素来解答问题。因此,借用主成分分析法,利用贡献率(贡献率越大对葡萄的质量影响越大)的大小,选出对影响酿酒葡萄分级的因素,并利用红地球葡萄的分级标准对酿酒葡萄进行分级。

4.3问题三的分析

针对问题三,考虑酿酒葡萄和葡萄酒的理化指标这两组变量之间的联系,本文采用典型相关分析法,根据几对综合变量来反映两组样本之间的线性相关性。由于典型相关分析模型不能准确描述两组变量之间的关系,为了更加准确,建立了多元回归模型,进而精确得出酿酒葡萄和葡萄酒的理化指标二者之间的关系。 4.4问题四的分析

3

针对问题四,若要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,则需先求得它们之间的相关性(问题三已经得出)。灰色系统理论[1]提出了对各子系统(或因素)之间的数值关系。故本题运用灰色关联度分析模型对系统二者的关系进行度量。并运用其结论分析葡萄和葡萄酒的理化指标对葡萄酒的质量的影响。

5模型的建立与求解

5.1模型一的建立与求解 5.1.1模型一的建立

在处理第一组、第二组评酒员品红葡萄酒评分时,首先,假设第一组,第二组无差异,即原假设A0:x1?x2,那么对应的备择假设是:

A0:x1?x2.

处理平均数t测验公式:如x1,x2和SS1,SS2分别是均值和离均差平方和,n1,n2为处理的重复次数,则

t=x1-x2/Sx1-x2 ( 1)自由度 df=n1+n2-2

这里Sx1-x2为x1?x2的标准误差,其计算公式为:

Sx1-x2?(n1?n2)(SS1?SS2) n1n2(n1?n2?2)当处理重复次数相同时即n1?n2?n时,Sx1-x2的计算可简化为

Sx1-x2?(n1?n2) (SS1?SS2) (2)n1n2(n1?n2?2)因n1?n2,故处理均数差标准误差为:

Sx1-x2?(SS1?SS2) (3)[n(n?1)]再计算统计量t=x1-x2/Sx1-x2,自由度df=n1+n2-2 5.1.2模型一的求解

经查表得知:t临界值表为t0.05(18?,t0.01(18)?2.878。因t?t0.01(18故))2.101p?0.01拒绝A0,即在p?0.01的水平上两组评酒员的评价结果无显著性差异。

在解释结果时,根据p值大小直接进行统计,如p?0.05,表示差异显著,如果

4