第二十三章 现代优化算法简介

第二十三章 现代优化算法简介

§1 现代优化算法简介

现代优化算法是80年代初兴起的启发式算法。这些算法包括禁忌搜索(tabu search),模拟退火(simulated annealing),遗传算法(genetic algorithms),人工神经网络(neural networks)。它们主要用于解决大量的实际应用问题。目前,这些算法在理论和实际应用方面得到了较大的发展。无论这些算法是怎样产生的,它们有一个共同的目标-求NP-hard组合优化问题的全局最优解。虽然有这些目标,但NP-hard理论限制它们只能以启发式的算法去求解实际问题。

启发式算法包含的算法很多,例如解决复杂优化问题的蚁群算法(Ant Colony Algorithms)。有些启发式算法是根据实际问题而产生的,如解空间分解、解空间的限制等;另一类算法是集成算法,这些算法是诸多启发式算法的合成。

现代优化算法解决组合优化问题,如TSP(Traveling Salesman Problem)问题,QAP(Quadratic Assignment Problem)问题,JSP(Job-shop Scheduling Problem)问题等效果很好。

本章我们只介绍模拟退火算法,初步介绍一下蚁群算法,其它优化算法可以参看相关的参考资料。

§2 模拟退火算法

2.1 算法简介

模拟退火算法得益于材料的统计力学的研究成果。统计力学表明材料中粒子的不同结构对应于粒子的不同能量水平。在高温条件下,粒子的能量较高,可以自由运动和重新排列。在低温条件下,粒子能量较低。如果从高温开始,非常缓慢地降温(这个过程被称为退火),粒子就可以在每个温度下达到热平衡。当系统完全被冷却时,最终形成处于低能状态的晶体。

如果用粒子的能量定义材料的状态,Metropolis算法用一个简单的数学模型描述了退火过程。假设材料在状态i之下的能量为E(i),那么材料在温度T时从状态i进入状态j就遵循如下规律:

(1)如果E(j)?E(i),接受该状态被转换。

(2)如果E(j)?E(i),则状态转换以如下概率被接受:

e

其中K是物理学中的波尔兹曼常数,T是材料温度。

在某一个特定温度下,进行了充分的转换之后,材料将达到热平衡。这时材料处于状态i的概率满足波尔兹曼分布:

PT(x?i)?E(i)?E(j)KTej?S?E(i)KT?E(j)KT

?e其中x表示材料当前状态的随机变量,S表示状态空间集合。

显然

-271-

limT??e?E(i)KT?E(j)KT??ej?S1 |S|其中|S|表示集合S中状态的数量。这表明所有状态在高温下具有相同的概率。而当温度下降时,

limT?0ej?S?E(i)?EminKTE(j)?Emin?KT?limT?0j?Smine?E(i)?EminKT?ee??eE(j)?Emin?KT?j?Smin?eE(j)?Emin?KT

?limT?0E(i)?EminKT?E(j)?EminKTj?Smin?e?1 若i?Smin???|Smin| ?0 其它?其中Emin?minE(j)且Smin?{i|E(i)?Emin}。

j?S上式表明当温度降至很低时,材料会以很大概率进入最小能量状态。

假定我们要解决的问题是一个寻找最小值的优化问题。将物理学中模拟退火的思想应用于优化问题就可以得到模拟退火寻优方法。

考虑这样一个组合优化问题:优化函数为F:x?R,其中x?S,它表示优化问题的一个可行解,R?{y|y?R,y?0},S表示函数的定义域。N(x)?S表示x的一个邻域集合。

首先给定一个初始温度T0和该优化问题的一个初始解x(0),并由x(0)生成下一个解x'?N(x(0)),是否接受x'作为一个新解x(1)依赖于下面概率:

?? 若f(x')?f(x(0))?1 ?P(x(0)?x')???f(x')?f(x(0)) T0?其它?e换句话说,如果生成的解x'的函数值比前一个解的函数值更小,则接受x(1)?x'作为

一个新解。否则以概率e接受x'作为一个新解。

泛泛地说,对于某一个温度Ti和该优化问题的一个解x(k),可以生成x'。接受x'作为下一个新解x(k?1)的概率为:

?f(x')?f(x(0))T0 若f(x')?f(x(k))?1 ? P(x(k)?x')???f(x')?f(x(k)) (1) T0?其它?e在温度Ti下,经过很多次的转移之后,降低温度Ti,得到Ti?1?Ti。在Ti?1下重复上述

过程。因此整个优化过程就是不断寻找新解和缓慢降温的交替过程。最终的解是对该问题寻优的结果。

我们注意到,在每个Ti下,所得到的一个新状态x(k?1)完全依赖于前一个状态

-272-

x(k),可以和前面的状态x(0),?,x(k?1)无关,因此这是一个马尔可夫过程。使用马尔可夫过程对上述模拟退火的步骤进行分析,结果表明:从任何一个状态x(k)生成x'的概率,在N(x(k))中是均匀分布的,且新状态x'被接受的概率满足式(1),那么经过有限次的转换,在温度Ti下的平衡态xi的分布由下式给出:

Pi(Ti)?e?f(xi)Tf(xi)?Ti (2)

?ej?S当温度T降为0时,xi的分布为:

?1 若xi?Smin?* Pi??|Smin|

?0 其它?并且

xi?Smin?P*i?1

这说明如果温度下降十分缓慢,而在每个温度都有足够多次的状态转移,使之在每一个

温度下达到热平衡,则全局最优解将以概率1被找到。因此可以说模拟退火算法可以找到全局最优解。

在模拟退火算法中应注意以下问题:

(1)理论上,降温过程要足够缓慢,要使得在每一温度下达到热平衡。但在计算机实现中,如果降温速度过缓,所得到的解的性能会较为令人满意,但是算法会太慢,相对于简单的搜索算法不具有明显优势。如果降温速度过快,很可能最终得不到全局最优解。因此使用时要综合考虑解的性能和算法速度,在两者之间采取一种折衷。

(2)要确定在每一温度下状态转换的结束准则。实际操作可以考虑当连续m次的转换过程没有使状态发生变化时结束该温度下的状态转换。最终温度的确定可以提前定为一个较小的值Te,或连续几个温度下转换过程没有使状态发生变化算法就结束。 (3)选择初始温度和确定某个可行解的邻域的方法也要恰当。 2.2 应用举例

例 已知敌方100个目标的经度、纬度如下: 经度 纬度 经度 纬度 经度 纬度 经度 纬度 53.7121 15.3046 51.1758 0.0322 46.3253 28.2753 30.3313 6.9348 56.5432 21.4188 10.8198 16.2529 22.7891 23.1045 10.1584 12.4819 20.1050 15.4562 1.9451 0.2057 26.4951 22.1221 31.4847 8.9640 26.2418 18.1760 44.0356 13.5401 28.9836 25.9879 38.4722 20.1731 28.2694 29.0011 32.1910 5.8699 36.4863 29.7284 0.9718 28.1477 8.9586 24.6635 16.5618 23.6143 10.5597 15.1178 50.2111 10.2944 8.1519 9.5325 22.1075 18.5569 0.1215 18.8726 48.2077 16.8889 31.9499 17.6309 0.7732 0.4656 47.4134 23.7783 41.8671 3.5667 43.5474 3.9061 53.3524 26.7256 30.8165 13.4595 27.7133 5.0706 23.9222 7.6306 51.9612 22.8511 12.7938 15.7307 4.9568 8.3669 21.5051 24.0909 15.2548 27.2111 6.2070 5.1442 49.2430 16.7044 17.1168 20.0354 34.1688 22.7571 9.4402 3.9200 11.5812 14.5677

-273-

52.1181 0.4088 9.5559 11.4219 24.4509 6.5634 26.7213 28.5667 37.5848 16.8474 35.6619 9.9333 24.4654 3.1644 0.7775 6.9576 14.4703 13.6368 19.8660 15.1224 3.1616 4.2428 18.5245 14.3598 58.6849 27.1485 39.5168 16.9371 56.5089 13.7090 52.5211 15.7957 38.4300 8.4648 51.8181 23.0159 8.9983 23.6440 50.1156 23.7816 13.7909 1.9510 34.0574 23.3960 23.0624 8.4319 19.9857 5.7902 40.8801 14.2978 58.8289 14.5229 18.6635 6.7436 52.8423 27.2880 39.9494 29.5114 47.5099 24.0664 10.1121 27.2662 28.7812 27.6659 8.0831 27.6705 9.1556 14.1304 53.7989 0.2199 33.6490 0.3980 1.3496 16.8359 49.9816 6.0828 19.3635 17.6622 36.9545 23.0265 15.7320 19.5697 11.5118 17.3884 44.0398 16.2635 39.7139 28.4203 6.9909 23.1804 38.3392 19.9950 24.6543 19.6057 36.9980 24.3992 4.1591 3.1853 40.1400 20.3030 23.9876 9.4030 41.1084 27.7149 我方有一个基地,经度和纬度为(70,40)。假设我方飞机的速度为1000公里/小时。我方派一架飞机从基地出发,侦察完敌方所有目标,再返回原来的基地。在敌方每一目标点的侦察时间不计,求该架飞机所花费的时间(假设我方飞机巡航时间可以充分长)。

这是一个旅行商问题。我们依次给基地编号为1,敌方目标依次编号为2,3,?,101,最后我方基地再重复编号为102(这样便于程序中计算)。距离矩阵D?(dij)102?102,其中dij表示表示i,j两点的距离,i,j?1,2,?,102,这里D为实对称矩阵。则问题是求一个从点1出发,走遍所有中间点,到达点102的一个最短路径。

上面问题中给定的是地理坐标(经度和纬度),我们必须求两点间的实际距离。设A,B两点的地理坐标分别为(x1,y1),(x2,y2),过A,B两点的大圆的劣弧长即为两点的实际距离。以地心为坐标原点O,以赤道平面为XOY平面,以0度经线圈所在的平面为XOZ平面建立三维直角坐标系。则A,B两点的直角坐标分别为:

A(Rcosx1cosy1,Rsinx1cosy1,Rsiny1) B(Rcosx2cosy2,Rsinx2cosy2,Rsiny2) 其中R?6370为地球半径。 A,B两点的实际距离

???OA?OB? d?Rarccos??,

?OA?OB???化简得

(xc1o?sx2)cosy1cosy2?siny1siny2]。 d?Rarccos[求解的模拟退火算法描述如下: (1)解空间

,102}的所有固定起点和终点的循环排列集合,即 解空间S可表为{1,2,?,101

S?{(?1,?,?102)|?1?1,(?2,?,?101)为{2,3,?,101}的循环排列,?102?102} 其中每一个循环排列表示侦察100个目标的一个回路,?i?j表示在第i次侦察j点,初始解可选为(1,2,?,102),本文中我们使用Monte Carlo方法求得一个较好的初始解。

(2)目标函数

-274-

联系客服:779662525#qq.com(#替换为@)