葡萄酒的评价问题
摘要
科学地对葡萄酒的质量进行评价,关系到葡萄酒产业的发展方向,本文针对酿酒葡萄以及葡萄酒的理化指标进行建模以对其进行科学的定量分析,解决了葡萄酒的分级问题,并得到其中的相互联系和相互影响关系.
针对问题一,我们建立了熵权法模型,先通过对两组品酒员的评分赋予相应的权重,继而求出每种葡萄酒加权后获得的总分,再分别对两组评价结果的值进行做差,通过作图获得两组评价结果的差异大小,发现差值并没有稳定在一个小范围内,而是上下大幅度波动,故得出两组品酒员的评价结果存在显著性差异,接着利用品酒员离差系数的计算,第一组离差系数为0.118376,第二组为0.082758,因此得到第二组的评价结果更可信.
针对问题二,我们采用主成分分析法,先将酿酒葡萄的理化指标进行降维处理,提取了9种影响指标,然后再制定分级标准对这9种指标进行分级,分成五个等级,从高到低各个等级的指数值依次为5,4,3,2,1,计算得出相应的综合评价指数. 接着,根据问题一中得到的第二组葡萄酒的评价可信性更高的结论,我们将所得的加权总分再进行分级,最后利用“木桶效应”对上述酿酒葡萄的理化指标和葡萄酒质量的分级结果取分级低的那个级别作为最终的酿酒葡萄的分级,得到红葡萄样品23与白葡萄样品3、6、18、24为一级,而红葡萄样品4、13、18与白葡萄样品1、14为五级.
针对问题三,我们选取相关系数模型,对酿酒葡萄与葡萄酒的共同理化指标建立相关关系,并做出相关散布图,继而求出相关系数rxy,通过对|rxy|接近1和0的判断以及rxy正负的判断,最终确定酿酒葡萄与葡萄酒的理化指标之间的联系.
针对问题四,我们建立了灰色关联分析模型,并通过对关联ri的验证,得到酿酒红葡萄的理化指标与红葡萄酒质量的灰色关联度为0.587,红葡萄酒的理化指标与红葡萄酒质量为0.526,酿酒白葡萄的理化指标与白葡萄酒质量的灰色关联度为0.569,白葡萄酒的理化指标与白葡萄酒质量为0.665,从而证明这四种关系中两两之间的关联性都成立,然后利用“反证法”引入芳香物质作为感官指标的核心指标,结合第三问的理论,再根据集合关系最终得到感官指标不足以评价葡萄酒的质量,而葡萄和葡萄酒的理化指标可以用来评价葡萄酒的质量.
本文最大的亮点在模型求解时的简化,并通过作图对问题做更直观地分析,最后,通过对模型的优缺点进行客观评价,并提出了改进方法,同时也为模型的推广提供了方向.
关键词:葡萄酒的评价; 酿酒葡萄;理化指标;葡萄酒的质量
1
一、问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评. 每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量.酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量. 附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据. 请尝试建立数学模型讨论下列问题:
问题一:分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级. 问题三:分析酿酒葡萄与葡萄酒的理化指标之间存在怎样的联系?
问题四:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
二、问题分析
2.1. 问题一的分析
问题一要求对品酒员的评价结果分析显著差异性,并解决哪一组更可信问题.题目中已经给出了两组品酒员对葡萄酒包括外观、香气、口感在内项目评定的分数,考虑到各个品酒员的打分水平不尽相同,所以关键是要确立两组品酒员评分的权重,并且权重要体现每位品酒员评分的差异性.
加权的方法有很多种,诸如平均加权法,动态惩罚加权法等,但对于此种多影响因素的加权,熵权法模型是一个很好的选择.熵权法是一种客观赋权方法,在具体使用过程中,熵权法根据各指标的变异程度,利用信息熵计算出各指标的熵权,再通过熵权对各指标的权重进行修正,从而得出较为客观的指标权重. 这样就可以达到我们的目的.
接着,通过权重对每一组中的红酒、白酒进行求解加权总分,再做两组加权总分的差值,通过作图就可以很直观的看到两组评价结果的差异性了. 而对于可信性问题,可以通过离差系数来求解数据的波动性,继而分析出可信性. 2.2. 问题二的分析
问题二要求对酿酒葡萄进行分级.我们需要先确定酿酒葡萄的理化指标的分级和葡萄酒质量的分级,然后进行两个分级的再综合而得到最终的分级.
为此我们要先制定分级的标准,利用主成分分析法对数据进行处理,选取酿酒葡萄主要的影响指标,然后对这些成分测定数据进行分级[1],各成分指标以其平均数为基准向两侧等距分级,分级间间距为最大值与最小值之差除以分级数所得的数值,并剔除较大及较小的特殊数据,从高到低分为5个等级.根据该划分标准,求出每个理化成分所对应的指数值,将各项指数值累加得到不同品种的综合评价指标.
接着由题目意思,我们需要再考虑葡萄酒的质量分级,可以根据问题一中的品酒员加权总数确定下来的那一组葡萄酒作为分级的基础,同样利用上述分级的原则,对葡萄酒的质量进行分级.
最后,我们通过酿酒葡萄的理化指标以及葡萄酒的质量进行数据的再处理,最终确定酿酒葡萄的各分级. 2.3. 问题三的分析
此问题要求找出酿酒葡萄与葡萄酒的理化指标之间的联系,首先需要找出酿酒葡萄
2
与葡萄酒具有的共同指标,这样才能确定它们之间的联系.为了进一步挖掘二者关系,我们选取相关系数模型,从而可以建立起酿造葡萄与葡萄酒的共同指标之间的相关关系,做出相关散布图,得到直观的相关关系程度,并求得相关系数来作为进一步的分析. 同时为了获得更好的相关性分析,我们又对酿酒葡萄的总指标以及葡萄酒的总指标进行分析,在宏观上把握二者的相关性. 2.4. 问题四的分析
问题要求分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,首先我们需要确定酿酒葡萄和葡萄酒的理化指标是否能对葡萄酒质量产生影响. 为此我们建立了灰色关联分析模型,计算酿酒葡萄及葡萄酒与葡萄酒质量之间的关联度,继而确认他们的影响关系.
接下来,为了更好地论证葡萄酒的质量影响因素,我们查阅相关资料发现,除了理化指标对葡萄酒的质量有影响外,感官指标也有可能对其产生影响,而对葡萄酒的感官指标最直观的影响因素便是葡萄酒的香味,而香味又是葡萄酒中的芳香物质发挥着作用,这样我们需要针对题目中提供给我们的芳香物质进行论证.
三、模型假设
模型一假设:
假设一:品酒员之间的打分互不影响,相互独立,而且品酒员之间存在打分水平的高低;
假设二:品酒员不存在过于主观判断的现象,故意抬高或压低某种葡萄酒的分数;
模型二假设:
假设一:二级指标是一级指标的子分级,用一级指标可以代替下属的二级指标来进行量的计算,有一定误差但可暂不考虑二级指标;
假设二:多次测量得到的数据项目可以通过求平均值获得该项目的含量值;
模型三、四假设:
葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量.
四、模型符号
4.1. 模型一符号
m:葡萄酒种数
n:品酒员人数
pi:每种状态出现的概率 (i=1,2,…,m)
R:m和n形成的原始数据的矩阵
w1:第一组葡萄酒各品酒员的评分权重 w2:第二组葡萄酒各品酒员的评分权重 4.2. 模型二符号
p:前p个主成分
3
4.3. 模型三符号
rxy:x与y轴两种变量的相关系数 4.4. 模型四符号
ξi(k) :关联系数
ri:关
x:比较对象的个数 y:评价对象的个数
五、模型的建立和求解
5.1 . 问题一的模型建立和求解 5.1.1. 熵权法模型的建立
根据问题分析当由题目所述的品酒员的评分系统,处于多种不同的状态. 而每种状态出现的概率为pi时,则该系统的熵就定义为:
e???pilnpi.
i?1m显然,当pi?1/m时,即各种状态出现的概率相同时,熵取最大值为:
emax?lnm.
现有m个待评项目,即题目中的葡萄酒的种类,n个评价指标,即品酒员数,则形成原始评价矩阵R?(rij)m?n对于某个指标rj有信息熵:
e???pij?lnpij,其中 pij?rij/?rij.
i?1i?1mm从上述式子分析可得如果某个指标的熵值ej越小,说明其指标值的变异程度越大,提供的信息量越多,在综合评价中该指标起的作用越大,其权重应该越大; 如果某个指标的熵值ej越大,说明其指标值的变异程度越小,提供的信息量越少,在综合评价中起的作用越小,其权重也应越小.
这样,根据各品酒员的变异程度,利用熵来计算各品酒员的熵权,利用各品酒员的熵权对所有品酒员进行加权,从而得出较为客观的品酒员评分的权值. 依照上述原理,首先建立原始数据矩阵:
?r11r12r13?r1n???r?r2n??rrR??212223?,
???????r??m1rm2rm3?rmn?其中rij为第j个品酒员对第i种葡萄酒的评价值.
接下来我们再求各个品酒员所评分数值的权重过程:
步骤1 计算第j个品酒员对第i种葡萄酒的指标值比重pij:
pij?rij/?rij;
i?1m
4