数学建模方法详解--三十四种常用算法 下载本文

A??xij?n?m,如果xi与xj的相似程度为rij?R(xi,xj)(i,j?1,2,?,n),则称之为相似系

~数,确定相似系数rij有多种不同的方法。常用的方法如下:

(1) 数量积法

xi?{xi1,xi2,?,xim}?U,令

?m?M?max??xik?xjk?i?j?k?1?,则取

i?j?1,rij?1?m?r?[0,1]r?,显然ij。若出现有某些rij?0,可令ij,rij??12x?x,i?j?M?ikjk?k?1??[0,1]。也可以用平移-极差变换将其压缩到[0,1]上,即可以得到模糊相则有rij似矩阵R?rij??n?m。

m(2) 夹角余弦法(相似系数统计量): 令

?xrij?k?1m2ikk?1ikxjkm(i,j?1,2,?,n)

2jk?x??xk?1则R?rij??n?n。

m(3) 相关系数法(相关系数统计量): 令

??xrij?k?1ik?xi??xjk?xj???xk?1mik?xi????x2k?1mjk?xjn?n?(i,j?1,2,?,n)

21m1m其中xi??xik,xj??xjk,则R?rijmk?1mk?1??。

注意:xi?{xi1,xi2,?,xim}中的样本xik属于同一个样本空间Xi(k?1,2,?,m)。 (4) 指数相似系数法: 令

2?1m?3(xik?xjk)??rij??exp??? 2mk?1?sk??4?21n1n其中sk??xik?xk,xk??xik(k?1,2,?,m)。则R?rijn?n。

ni?1ni?1注意:xi?{xi1,xi2,?,xim}中的样本xik属于不同的样本空间Xk,即

????xik?Xk(k?1,2,?,m)。

(5) 最大最小值法: 令

rij???x??xk?1k?1mmik?xjk??xjkik?(xij?0;i,j?1,2,?,n)

则R?rij??n?n。

(6) 算术平均值法: 令

rij?则R?rij??xk?1mmik?xjk???1xik?xjk?2k?1??(xij?0;i,j?1,2,?,n)

n?n。

(7) 几何平均值法:令

rij?则R?rij??xk?1mmik?xjk?(xij?0;i,j?1,2,?,n)

?k?1xik?xjk??n?n。

(8) 绝对值倒数法:令

i?j?1,??1rij???m ?Mx?x,i?j??jk??ik???k?1其中M为使得所有rij?[0,1](i,j?1,2,?,n)的确定常数,则R?rij??n?n。

(9) 绝对值指数法:令

则R?rij???m?rij?exp???xik?xjk?(i,j?1,2,?,n)

?k?1?。

n?n (10) 海明距离法(距离系数统计量。如果变量的量纲不同,原始数据变异

范围相差悬殊时,建议首先进行数据的标准化处理,然后再计算距离):令

?rij?1?H?d(xi,xj)?m(i,j?1,2,?,n) ??d(xi,xj)??xik?xjkk?1?其中H为使得所有rij?[0,1](i,j?1,2,?,n)的确定常数。则R?rijn?n。

??(11) 欧氏距离法(最常用):令

?rij?1?E?d(xi,xj)?m(i,j?1,2,?,n) ?2?d(xi,xj)???xik?xjk?k?1?其中E为使得所有rij?[0,1](i,j?1,2,?,n)的确定常数。则R?rij (12) 契比雪夫距离法:令

?rij?1?Q?d(xi,xj)?m??d(xi,xj)??xik?xjkk?1???n?n。

(i,j?1,2,?,n)

其中Q为使得所有rij?[0,1](i,j?1,2,?,n)的确定常数。则R?rij??n?n。

(13) 主观评分法:设有N个专家组成专家组{p1,p2,?,pN},让每一位专家对所研究的对象xi与xj相似程度给出评价,并对自己的自信度作出评估。如果第k位专家pk关于对象xi与xj的相似度评价为rij(k),对自己的自信度评估为

aij(k)(i,j?1,2,?,n),则相关系数定义为

rij?则R?rij??ak?1Nij(k)?rij(k)?(i,j?1,2,?,n)

ij?ak?1N(k)??n?n。

综上所述,以上给出了实际中能够使用的一些方法,具体地选择要根据具体问题的性质和使用的方便来确定。

在实际工作中,当需要研究样品与样品之间关系时,一般用距离系数统计量或者相似系数统计量作为分类计算依据,这种方法又称为Q型聚类法;当需要研究变量与变量之间的关系时,常用相关系数统计量作为分类计算依据,这种方法又称R型聚类法。

选择适当的聚类方法

聚合法

开始把每个样品看成自成一类,计算各类之间的相似程度的统计量,把最相似的两类合并为一类,再计算各类相似程度统计量,把最相似的两类合并,照此继续下去,一直到所有样品都聚合成一类为止,最后人为确定合适的分类数,得到分类结果。 分解法

它的聚类过程恰好和聚合法相反,开始把全体样品看成一类,然后分成二类,??,一直到每个样品为一类或分到不能再分时为止,通常要设计一个分类函数(目标函数)来控制整个分类过程。 调优法

开始人为将样品作初始分类,在一定准则下判断这个分类是否最优,如果不是最优,则对分类进行修改,再判断修改后的分类是否最优,若仍不是最优,再作修改,不断重复上述步骤,一直到分类方案最优为止。 *动态聚类法

步骤:

1、按照一定的原则选择一批凝聚点(聚核),

2、让样品向最近的凝聚点凝聚,这样就由点凝聚成类,得到初始分类。 3、初始分类不一定合理,可按最近距离原则进行修改,直到分类合理得到最终的分类为止。

四、最小二乘法与多项式拟合 一)、最小二乘法的基本原理

从整体上考虑近似函数p(x)同所给数据点(xi,yi)(i=0,1,?,m)误差

ri?p(xi)?yi(i=0,1,?,m)

riri?p(xi)?yi(i=0,1,?,m)绝对值的最大值max0?i?m,即误差 向量

r?(r0,r1,?rm)的∞—范数;二是误差绝对值的和?i?0Tmri,即误差向量r的1—

范数;三是误差平方和的算术平方根,即误差向量r的2—范数;前两种方法简单、自然,但不便于微分运算 ,后一种方法相当于考虑 2—范数的平方,

ii?0?rm2因此在曲线拟合中常采用误差平方和体大小。

?ri?0m2i来 度量误差ri(i=0,1,?,m)的整

数据拟合的具体作法是:对给定数据 (xi,yi) (i=0,1,?,m),在取定的函数类?中,求p(x)??,使误差ri?p(xi)?yi(i=0,1,?,m)的平方和最小,即

i?0?rim2=i?02??p(x)?y?ii?minm

从几何意义上讲,就是寻求与给定点(xi,yi)(i=0,1,?,m)的距离平方和为最

小的曲线y?p(x)(图6-1)。函数p(x)称为拟合 函数或最小二乘解,求拟合函数p(x)的方法称为曲线拟合的最小二乘法。

?可有不同的选取方法.

6—1

二)、多项式拟合

?为所有次数不超过n(n?m)的多项式构假设给定数据点(xi,yi)(i=0,1,?,m),成的函数类,现求一

m

pn(x)??akxk??k?0n,使得

2I???pn(xi)?yi?i?02?n?????akxik?yi??mini?0?k?0? (1)

m当拟合函数为多项式时,称为多项式拟合,满足式(1)的pn(x)称为最小二乘

拟合多项式。特别地,当n=1时,称为线性拟合或直线拟合。 显然