模拟退火算法是一种通用概率演算法,用来在一个大的搜寻空间内找寻命题的最优解。模拟退火的出发点是基于物理中固体物质的退火过程与一般组合优化问题之间的相似性。模拟退火算法是一种通用的优化算法,其物理退火过程由加温过程、等温过程、冷却过程这三部分组成。

原理:模拟退火的原理也和金属退火的原理近似,将热力学的理论套用到统计学上,将搜寻空间内每一点想像成空气内的分子;分子的能量,就是它本身的动能;而搜寻空间内的每一点,也像空气分子一样带有“能量”,以表示该点对命题的合适程度。演算法先以搜寻空间内一

模拟退火算法每次的解为什么不一样?

模拟退火每次的解不同是很正常的,因为模拟退火本身是一种随机算法,转移向更差的解不是必然而是概率性的,也就是说每次执行算法时,执行过程转移到的解可能都是完全不一样的。

至于TSP问题,本身属于NP-hard问题,找不到存在多项式时间复杂度的解。

如果要求精确的解,目前可行的方法有枚举、分支限界、动态规划等,但这些方法适用的数据范围都很小,一旦数据规模变大,它们都将无能为力。

所以目前广泛使用的大都是一些随机算法,比如蚁群、遗传等,模拟退火就是其中的一种,这些算法的一大特点就是通过随机去逼近最优解,但也有可能得到错解。

只有穷举法可以保证得到最优解,但是穷举法在数据量比较大的时候运行时间通常是不能接受的,所以用了各种近似方法。

模拟退火算法新解的产生和接受可分为如下四个步骤:

第一步是由一个产生函数从当前解产生一个位于解空间的新解;为便于后续的计算和接受,减少算法耗时,通常选择由当前新解经过简单地变换即可产生新解的方法,如对构成新解的全部或部分元素进行置换、互换等,注意到产生新解的变换方法决定了当前新解的邻域结构,因而对冷却进度表的选取有一定的影响。

第二步是计算与新解所对应的目标函数差。因为目标函数差仅由变换部分产生,所以目标函数差的计算最好按增量计算。事实表明,对大多数应用而言,这是计算目标函数差的最快方法。

第三步是判断新解是否被接受,判断的依据是一个接受准则,最常用的接受准则是Metropolis准则: 若ΔT<0则接受S′作为新的当前解S,否则以概率exp(-ΔT/T)接受S′作为新的当前解S。

第四步是当新解被确定接受时,用新解代替当前解,这只需将当前解中对应于产生新解时的变换部分予以实现,同时修正目标函数值即可。此时,当前解实现了一次迭代。可在此基础上开始下一轮试验。而当新解被判定为舍弃时,则在原当前解的基础上继续下一轮试验。

模拟退火法<sup>[1,]</sup>

模拟退火算法最早在1953年由 Metropolis等人提出。在地球物理中的最早应用是Rothman在1983年利用模拟退火算法处理地震资料的剩余静校正。模拟退火法也是类似于蒙特卡洛法的随机搜索方法。但是在产生模型的过程中引入一些规则,能有效地加快搜索速度,有时又称这类方法为启发式蒙特卡洛法。

模拟退火法概念源于统计物理学,是模拟固体熔化状态逐渐缓慢冷却最终达到能量最小的结晶状态的物理过程。对于一个熔化的金属,当处于某个温度的热平衡状态时,它的每一个分子都有它可能所处的状态,有些分子可能能量高一些,有些分子可能能量低一些,分子处于何种状态的概率由分子所具有的能量决定。设分子所有可能的能级总数为n(微观粒子的能量都是量子化的,不连续的),则分子处于某种状态的概率满足玻尔兹曼概率分布:

地球物理反演教程

其中:Ei为第i个分子的能量K为玻尔兹曼常数T为绝对温度n为分子所有可能的能级总数,分母称为配分因子pi为第i个分子处于能量Ei的概率。

如果把地球物理反演的模型向量看作分子,把目标函数看作分子的能量,把目标函数的极小值看成分子冷却结晶的最小能量,反演问题(最优化问题)可以模拟式(8.11)金属退火的过程,通过缓慢地减小温度进行反演,使目标函数(能量)逐渐达到极小值,这时所对应的模型(分子状态)就是反演结果。

为了改善于蒙特卡洛法的随机搜索方法,1953年 Metropolis等人在产生模型的过程中引入Metropolis接受准则,模型产生并不是完全随机,而是以前一个模型为基础随机产生。对能量减小的模型完全接受,对能量增加的模型按一定的概率接受,这样能有效地加快搜索速度,同时又有可能跳出局部极小值。具体如下:

设原来模型向量为mi,新的模型为mi+1(在mi基础上随机修改产生),各自的能量(目标函数)为E(mi)和E(mi+1)。如果E(mi+1)<E(mi),则目标函数在减小,新模型可以接受。如果E(mi+1)>E(mi),则目标函数在增加,按照一定概率来确定是否接受新的模型。具体规则见式(8.12):

E(mi+1)<E(mi) 完全接受mi+1为新模型

地球物理反演教程

式(8.12)就是Metropolis接受准则。它使得反演过程可以接受使目标函数增加的模型,因此也就使得模拟退火法有可能跳出局部极小,收敛于全局极小值点。由于玻尔兹曼常数K只是起到尺度因子的作用,在实际计算中K可取为1来简化公式。从式(8.12)可以看出,当温度较低时,pi+1/pi较小,因此接受使能量增加的新模型的可能性较小。而一般温度较低时,目标函数较小,模型比较靠近真实模型,这时基本上只接受使目标函数减小的模型,使模型尽快收敛于极小值点。

在模拟退火反演中,要求温度T随着迭代次数的增加而缓慢降温。常用的温度函数有两种。

(1)指数下降型:

Tk=T0·exp(-ck1/N) (8.13)

式中:k为迭代次数c为衰减因子N为模型参数的个数T0为初始温度。上式也可以改写为

地球物理反演教程

通常选择0.7≤α≤1。在实际应用中可采用0.5或1代替式(8.14)的1/N。图8.4(a)为指数降温曲线。采用参数为:T0=200℃,α=0.99,1/N=0.9。

(2)双曲线下降型:

T=T0αk (8.15)

式中:T0为初始温度k为迭代次数α为衰减因子,通常取0.99。初始温度T0不能取得太高,否则增加计算时间浪费机时T0也不能太低,否则模型选取不能遍及整个模型空间,只是在初始模型附近选取,不能进行全局寻优。所以T0的确定只有通过实验计算得到。图8.4(b)为双曲线降温曲线。采用参数为:T0=200℃,α=0.99。从图8.4可以看出通过对不同温度曲线和相关参数进行选择,可以控制温度下降的方式和速度。

图8.4 模拟退火法降温曲线

模拟退火法主要有三种:

(1)MSA算法(Metropolis Simulated Annealing)

(2)HBSA算法(Heat Bath Simulated Annealing)

(3)VFSA算法(Very Fast Simulated Annealing)。

图8.5 模拟退火MSA算法程序流程图

前面介绍的利用 Metropolis接受准则的算法就是经典的模拟退火法。图8.5为模拟退火 MSA算法的程序流程图。从中可以看出 MSA算法有一套模型修改准则,依次改变模型参数,每次改变都是在原来模型基础上改变一个参数,因此容易保持已有搜索成果,持续不断地向目标函数最小值点接近,因此搜索效率比蒙特卡洛法高。此外,MSA算法允许接受使目标函数增加的模型,这样又易于跳出局部极小,达到全局极小。但 MSA算法在任何温度下和蒙特卡洛法一样都是在模型全空间进行搜索,不能根据当前温度和模型减小搜索空间,此外由于模型的修改全凭运气,所以不可能像前面介绍的最小二乘法那样目标函数基本上持续减小,而是呈不规则振荡在宏观上逐渐减小,因此效率较低。

HBSA算法与 MSA算法的不同之处是在模型的修改上。也是首先随机选择一个初始M维模型向量m0(它具有M个参数)然后限制各个模型参数可能的取值范围,对取值离散化。假设每个模型参数都有N个可能的值,首先固定模型第2个参数m0(2)直到第M个参数m0(M)保持不变,只修改第1个参数m0(1)计算m0(1)的所有取值时的目标函数,然后按式(8.16)计算“概率”,它就是式(8.11)配分因子取1的公式。即

地球物理反演教程

选择“概率”最大的为模型第1个参数的修改值。照此依次对所有模型参数进行修改完成依次迭代计算。在每次迭代计算中保持温度不变。随着迭代次数增加,温度降低,最终达到稳定状态,获得最小能量解。这种方法的计算由于要计算某个参数的所有可能值,所以计算量也是很大的。

1989年Ingber提出了VFSA算法,由于速度较快,最为常用。它使得模拟退火法从理论走向了实际应用。VFSA算法在流程上与传统的模拟退火法相同,但是在模型修改、接受概率以及降温曲线上有所改进。

(1)模型修改:常规模拟退火法采用高斯随机分布修改模型,在任何温度下都是在模型全空间进行搜索。而Ingber提出采用依赖于温度的似cauchy分布产生新的模型。即

地球物理反演教程

yi=Tsgn(u-0.5)[(1+1/T|2u-1|-1](8.18)

其中:mi为当前模型第i个参数,m'i为修改后的模型参数u为[0,1]的随机数[Ai,Bi]为mi和m'i的取值范围sgn( )为符号函数。

采用以上方式能在高温下进行大范围的搜索,低温时在当前模型附近搜索,而且由于似cauchy分布具有平坦的“尾巴”,使其易于迅速跳出局部极值。这一改进大大加快了模拟退火法的收敛速度。

(2)接收概率:当E(mi+1)>E(mi)时,VFSA算法采用如下概率接受公式:

地球物理反演教程

上式当h→1时变为式(8.12)。h通过实验获得。

(3)降温曲线(退火计划):Ingber在1989年采用式(8.13)得出指数降温曲线。从图8.4可知,温度下降较快。

总之,VFSA算法在模型修改、接受概率以及降温曲线上的改进使得模拟退火算法收敛速度大大加快。后人在此基础上还有很多的改进,读者可以参考相关文献。

模拟退火法的优点:由于不需要计算偏导数矩阵,不需要解线性方程组(当然正演计算的除外),结构简单,易于编程此外,由于它搜索范围大,能接受较差模型,因此易于达到全局极小。缺点:随机搜索,计算量巨大,往往要计算成百上千次正演,这与前面的最小二乘法十几次的正演计算相比反演时间太长,因此一般应用在一维反演之中,在二维、三维等高维反演中应用较少。

模拟退火算法的简介

模拟退火算法(Simulated Annealing,SA)最早的思想是由N. Metropolis 等人于1953年提出。1983 年,S. Kirkpatrick 等成功地将退火思想引入到组合优化领域。它是基于Monte-Carlo迭代求解策略的一种随机寻优算法,其出发点是基于物理中固体物质的退火过程与一般组合优化问题之间的相似性。模拟退火算法从某一较高初温出发,伴随温度参数的不断下降,结合概率突跳特性在解空间中随机寻找目标函数的全局最优解,即在局部最优解能概率性地跳出并最终趋于全局最优。模拟退火算法是一种通用的优化算法,理论上算法具有概率的全局优化性能,目前已在工程中得到了广泛应用,诸如VLSI、生产调度、控制工程、机器学习、神经网络、信号处理等领域。

模拟退火算法是通过赋予搜索过程一种时变且最终趋于零的概率突跳性,从而可有效避免陷入局部极小并最终趋于全局最优的串行结构的优化算法。