专栏名称: 程序员大咖

为程序员提供最优质的博文、最精彩的讨论、最实用的开发资源；提供最新最全的编程学习资料：PHP、Objective-C、Java、Swift、C/C++函数库、.NET Framework类库、J2SE API等等。并不定期奉送各种福利。

白话讲解遗传算法 (Genetic Algorithm)

程序员大咖 · 公众号 · 程序员 · 2016-11-30 21:08

正文

点击上方蓝色字体关注「程序员大咖」

来源：raochaoxun

链接： http://blog.chinaunix.net/uid-27105712-id-3886077.html

遗传算法（Genetic Algorithm）又叫基因进化算法，或进化算法。属于启发式搜索算法一种，这个算法比较有趣，并且弄明白后很简单，写个100-200行代码就可以实现。在某些场合下简单有效。本文就花一些篇幅，尽量白话方式讲解一下。

首先说一下问题。在我们学校数据结构这门功课的时候，时常会有一些比较经典的问题（而且比较复杂问题）作为学习素材，如八皇后，背包问题，染色问题等等。上面列出的几个问题都可以通过遗传算法去解决。本文列举的问题是TSP(Traveling Salesman Problem)类的问题。

TSP问题实际上是”哈密顿回路问题”中的”哈密顿最短回路问题”.如下图，就是要把下面8个城市不重复的全部走一遍。有点像小时候玩的画笔画游戏，一笔到底不能重复。TSP不光是要求全部走一遍，并且是要求路径最短。就是有可能全部走一遍有很多走法，要找出其中总路程最短的走法。

和这个问题有点相似的是欧拉回路（下图）问题，它不是要求把每个点都走一遍，而是要求把每个边都不重复走一遍(点可以重复)，当然欧拉回路不是本算法研究的范畴。

本文会从TSP引申出下面系列问题

1、 TSP问题：要求每个点都遍历到，而且要求每个点只被遍历一次，并且总路程最短。

2、最短路径问题：要求从城市1 到城市8，找一条最短路径。

3、遍历m个点，要求找出其距离最短的路线。(如果m=N总数，其实就是问题1了，所以问题1可以看成是问题3的特例 )。

遗传算法的理论是根据达尔文进化论而设计出来的算法: 人类是朝着好的方向（最优解）进化，进化过程中，会自动选择优良基因，淘汰劣等基因。

在上面tsp问题中，一个城市节点可以看成是一个基因，一个最优解就是一条路径，包含若干个点。就类似一条染色体有若干基因组成一样。所以求最短路径问题，可以抽象成求最优染色体的问题。

遗传算法很简单，没有什么分支判断，只有两个大循环，流程大概如下

流程中有几个关键元素：

1、适度值评估函数。这个函数是算法的关键，就是对这个繁衍出来的后代进行评估打分，是优秀，还是一般，还是很差的畸形儿。用这个函数进行量化。在tsp中，路径越短，分数越高。函数可以可以这样 fitness = 1/total_distance. 或者 fitness = MAX_DISTANCE – total_distance. 不同的计算方法会影响算法的收敛速度，直接影响结果和性能。

2、选择运算规则: 又称选择算子。对应着达尔文理论中适者生存，也有地方叫着精英主义原则，意思就是只有优秀的人才有更大的几率存活下来，拥有交配权。有权利拥有更多后代，传承下自己血脉基因。和现实中很相像，皇帝权臣遗留下来的子孙后代比较多。选择方法比较多。最常见的是round robin selection 算法，即轮盘赌算法, 这个算法比较简单有效。选择算法目前已有的有10来种之多。各种不同业务可以按需选择。

选择公式如下:

//选择运算---轮盘赌,此算法要求不能有负数.

int32_t Genetic :: Selection ( Genome & selGenome )

{

//生成一个随机浮点数

//本算法在轮盘赌算法上加上了选择概率，提高最大可行解入围概率

double ftmp = ((( random ()) % 100001 ) / ( 100000 + 0.0000001 ));

if ( ftmp > 0.9 )

{

GetBestGenome ( selGenome );

return ESUCCESS ;

}

//生成一个【0， m_dTotalFitness】之间的随机浮点数

double dRange = ((( random () + random ()) % 100001 ) / ( 100000 + 0.0000001 )) * m_dTotalFitness

白话讲解遗传算法 (Genetic Algorithm)

正文

请到「今天看啥」查看全文