先进算法讲义.pdf

先进算法讲义先进算法讲义在本讲义中，我们将着重讲述一些数学建模中常用的算法，包括神经网络算法、遗传算法、模拟退火算法和模糊数学方法。用这些算法可以较容易地解决一些很复杂的，常规算法很难解决的问题。由于这些算法都有着很深的理论背景，因此，本讲义中不可能也没有必要详细地讨论这些算法的理论，我们的目标在于应用，大家只需大概了解这些算法的原理，知道能用这些算法解决一类什么样的问题，并能应用这些算法解决数学建模中的一些问题即可。因为着眼于应用，所以我们还提供了一些程序代码，使用者只需套用这些程序，便可使问题得到很好的解决。第一节神经网络第一节神经网络 1．．神经网络的简单原理神经网络的简单原理人工神经网络是根据人的认识过程而开发出的一种算法。假如我们现在只有一些输入和相应的输出，而对如何由输入得到输出的机理并不清楚，那么我们可以把输入与输出之间的未知过程看成是一个“网络” ，通过不断地给这个网络输入和相应的输出来“训练”这个网络，网络根据输入和输出不断地调节自己的各节点之间的权值来满足输入和输出。这样，当训练结束后，我们给定一个输入，网络便会根据自己已调节好的权值计算出一个输出。这就是神经网络的简单原理。 2．．神经元和神经网络的结构神经元和神经网络的结构如上所述，神经网络的基本结构如下图所示神经网络一般都有多层，分为输入层，输出层和隐含层，层数越多，计算结果越精确，但所需的时间也就越长，所以实际应用中要根据要求设计网络层数。神经网络中每一个节点叫做一个人工神经元，他对应于人脑中的神经元，两者的结构比较如下图一个人工神经元一般有多个输入和一个输出，另外有一个激发函数，不同的激发函数对应了不同的网络，也决定了网络的用途。 3．．神经网络的分类神经网络的分类神经网络按照网络结构和激发函数的不同可分为许多种，我们在此只是对感知器和 BP 网络进行简介。感知器最早也是最简单的一种神经网络，它的神经元激发函数为阶跃函数，其神经元结构如下图感知器主要用于分类。 BP网络应用得最为广泛，最为重要的一种神经网络。这种网络一般有多层，网络结构如下 BP 网络的激发函数一般采用 S 型函数，如正切或对数函数，其神经元结构如下 BP 网络的用途十分广泛，可用于以下方面函数逼近用输入矢量和相应的输出矢量训练一个网络逼近一个函数模式识别用一个特定的输出矢量将它与输入矢量联系起来分类把输入矢量以所定义的合适方式进行分类数据压缩减少输出矢量维数以便于传输或存储 4．．神经网络在数学建模中的应用神经网络在数学建模中的应用数学建模中有很多题目都可以用神经网络加以解决，比较典型的题目有DNA 序列分类题（2000 年全国赛 A 题），癌症判断题（2001 年北京大学数学建模竞赛），乳房癌的诊断题（2001 年全国大学生数学建模夏令营 C 题）。下面我们使用神经网络的方法解决癌症判断题（2001 年北京大学数学建模竞赛），题目如下附件中的文件给出了一个114个基因, 60个人的基因表达水平的样本. 其中前20个是癌症病人的基因表达水平的样本其中还可能有子类, 其后的是20个正常人的基因表达信息样本, 其余的20个是待检测的样本未知它们是否正常. 1.试设法找出描述癌症与正常样本在基因表达水平上的区别, 建立数学模型,及识别方法,去预测待检测样本是癌症还是正常样本. 2.设计图示可视化方法,使得在你的数学模型下, 尽量清楚地表现癌症与正常样本在基因表达水平上的区别, 以及癌症样本中是否有子类. 这道题是很典型的用神经网络的分类问题，只需用感知器神经网络便能完成此分类工作，我们用前 40 组数据对网络进行训练，再用训练号的网络来计算后 20 组数据，便能得到分类的结果。详细的程序可参见本讲义附带的 Matlab 程序。 5．．神经网络的程序设计神经网络的程序设计该讲义附带了如下程序资源 Matlab 神经网络工具箱函数简介癌症判断题（2001 年北京大学数学建模竞赛）的 Matlab 程序第二节遗传算法第二节遗传算法 1．．遗传算法的简单原理遗传算法的简单原理遗传算法Genetic Algorithm, GA是一种基于自然群体遗传演化机制的高效探索算法，它摒弃了传统的搜索方式，模拟自然界生物进化过程，采用人工进化的方式对目标空间进行随机化搜索。它将问题域中的可能解看作是群体的一个个体或染色体，并将每一个体编码成符号串形式，模拟达尔文的遗传选择和自然淘汰的生物进化过程，对群体反复进行基于遗传学的操作（遗传，交叉和变异），根据预定的目标适应度函数对每个个体进行评价，依据适者生存，优胜劣汰的进化规则，不断得到更优的群体，同时以全局并行搜索方式来搜索优化群体中的最优个体，求得满足要求的最优解。我们先通过一个例子来了解遗传算法的原理假定我们要求函数的极大值，其中 2 xxfx为自然数，0≤x≤31。现在，我们将每一个数看成一个生命体，通过进化，我们看谁能最后生存下来，谁就是我们所寻找的数。 ①．编码我们将每一个数作为一个生命体，那么必须给其赋予一定的基因，这个过程叫做编码。我们可以把变量 x 编码成 5 位长的二进制无符号整数表示形式，比如 x13 可表示为 01101 的形式，也就是说，数 13 的基因为 01101。 ②．初始群体的生成由于遗传的需要，我们必须设定一些初始的生物群体，让其作为生物繁殖的第一代，需要说明的是，初始群体的每个个体都是通过随机方法产生的，这样便可以保证生物的多样性和竞争的公平性。 ③．适应度评估检测生物的进化服从适者生存，优胜劣汰的进化规则，因此，我们必须规定什么样的基因是“优”的，什么样的基因是“劣”的，在这里，我们称为适应度。显然，由于我们要求的最大值，因此，能使较大的基因是优的，使较小的基因是劣的，因此，我们可以将定义为适应度函数，用来衡量某一生物体的适应程度。 2 xxf 2 xxf 2 xxf 2 xxf ④．选择接下来，我们便可以进行优胜劣汰的过程，这个过程在遗传算法里叫做选择。注意，选择应该是一个随机的过程，基因差的生物体不一定会被淘汰，只是其被淘汰概率比较大罢了，这与自然界中的规律是相同的。因此，我们可以采取赌论的方式来进行选择。 ⑤．交叉操作接下来进行交叉繁殖，随机选出两个生物体，让其交换一部分基因，这样便形成了两个新的生物体，为第二代。 ⑥．变异生物界中不但存在着遗传，同时还存在着变异，在这里我们也引入变异，使生物体的基因中的某一位以一定的概率发生变化，这样引入适当的扰动，能避免局部极值的问题。以上的算法便是最简单的遗传算法，通过以上步骤不断地进化，生物体的基因便逐渐地趋向最优，最后便能得到我们想要的结果。 2．．遗传算法的步骤遗传算法的步骤从上面的例子中，我们便能得到遗传算法的一般步骤，如下图所示 3．．遗传算法的应用遗传算法的应用遗传算法主要是用来寻优，它具有很多优点它能有效地避免局部最优现象，有及其顽强的鲁棒性，并且在寻优过程中，基本不需要任何搜索空间的知识和其他辅助信息等等。为了介绍遗传算法的应用，我们将前面的例子进行完，整个过程如下初始群体 01101 11000 01000 10011 x的值 13 24 8 19 适应度 169 576 64 361 2 xxf 选择概率 0.14 0.49 0.06 0.31 选择上的计数（来自赌轮） 1 2 0 1 交叉处 0110|0 1100|0 11|000 10|011 下一代群体 01100 1100 1 11011 10000 x的值 12 25 27 16 适应度 144 625 729 256 2 xxf 4．．遗传算法的程序设计遗传算法的程序设计本讲义提供了遗传算法求的 C 语言程序 x 2 sin 第三节模拟退火算法第三节模拟退火算法 1．．模拟退火算法的简单原理模拟退火算法的简单原理模拟退火算法主要用于解决组和优化问题，它是模拟物理中晶体物质的退火过程而开发的一种优化算法。在对固体物质进行模拟退火处理时，通常先将它加温熔化，使其中的粒子可自由运动，然后随着温度的逐渐下降，粒子也逐渐形成了低能态的晶格。若在凝结点附近的温度下降速率足够慢，则固体物质一定会形成最低能态的基态。对于组合优化问题来说，它也有这样的类似过程。组合优化问题解空间中的每一点都代表一个具有不同目标函数值的解。所谓优化，就是在解空间中寻找目标函数最小（大）解的过程。若把目标函数看成能量函数，某一控制参数视为温度 T，解空间当作形态空间，那么寻找基态的过程也就是求目标函数极小值的优化过程。 2．．模拟退火算法的应用模拟退火算法的应用如前所述，模拟退火算法主要用于解决组和优化问题，典型的例子是用模拟退火算法来解决 TSP 问题，本讲义附带了用模拟退火算法解决 TSP 问题的算法，有兴趣的同学可以参考模拟退火算法也经常用在神经网络中，本讲义也附带了一个模拟退火算法用在神经网络中的程序。第四节模糊数学方法第四节模糊数学方法 1．．模糊数学的简单原理模糊数学的简单原理 ①．模糊集对于传统集合，一个元素要么属于这个集合，要么不属于这个集合，我们用 1 表示元素属于该集合，用 0 表示元素不属于这个集合。模糊集合论认为，一个元素可以不完全属于一个集合，用[0，1]之间的一个数来表示一个元素属于一个集合的程度，这个数叫做该元素属于该集合的隶属度。 ②．模糊概念的清晰化我们可以设定一个数（比如 0.5），当一个元素的隶属度大于这个数时，我们就可以认为该元素属于这个集合，这就是模糊概念的清晰化。 2．．模糊数学的应用举例模糊数学的应用举例模糊数学在数学建模中主要用于模糊决策，这也是决策论中很重要的一部分内容，我们通过下面的例子来说明。有 7 名同学进行了毕业论文的答辩，有 10 位教授要对同学的答辩做出评分，评分采取等级制，各等级的分数如下评分标准一等二等三等四等五等六等分数 10 8 6 4 3 1 将参加评选的同学进行两两比较评分，例如x1→x2（以先评价的x2为基准，后评价的x1为对象进行相对比较评分）。比如 10 人所给相加的总分为 80 分，则学生x1对 x2的优先选择比为80. 0 100 80 12 r（其中分母 100 为 10 个教授都给最高分时的总分）相应的x2对x1的优先选择比为2 . 08 . 011 1221 −−rr。利用上面的方法便可以得到下表一等二等三等四等五等六等分数 10 8 6 4 3 1 评选组给被评人总分优先选择比rij x1- x23 4 3 80 0.80 x1- x31 5 3 1 72 0.72 x1- x42 5 2 1 76 0.76 x1- x56 2 1 1 86 0.86 x1- x63 1 4 2 70 0.70 x1- x74 3 1 2 78 0.78 x 2- x31 4 3 2 68 0.68 x 2- x44 2 1 1 1 1 70 0.70 x 2- x52 2 3 2 1 63 0.63 x 2- x65 2 1 2 80 0.80 x 2- x73 2 3 1 1 71 0.71 x 3- x4 2 3 4 1 53 0.53 x 3- x52 3 1 2 2 56 0.56 x 3- x6 2 2 1 2 3 41 0.41 x 3- x71 2 3 2 2 54 0.54 x 4- x6 2 3 1 4 31 0.31 x 4- x6 1 1 2 3 3 34 0.34 x 4- x71 1 2 3 3 36 0.36 x 5- x61 2 1 2 1 3 46 0.46 x5- x71 2 3 1 3 40 0.40 x 6- x71 2 2 2 3 43 0.43 于是可以得到优先选择矩阵 ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ 157. 060. 064. 046. 029. 022. 0 43. 0154. 066. 059. 020. 030. 0 40. 046. 0169. 044. 037. 014. 0 36. 034. 031. 0147. 030. 024. 0 54. 041. 056. 053. 0132. 028. 0 71. 080. 063. 070. 068. 0120. 0 78. 070. 086. 076. 072. 080. 01 1 R 70. 0λ，得λ-截矩阵为 ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ 1000000 0100000 0010000 0001000 0000100 1101010 1111111 1 7 . 0 R λ-截矩阵的第一行元素都等于 1，说明只有的优越度超过了 0.70，所以学生为第一优越对象。 1 7 . 0 R 1 x 1 x 除去 1 R中第一优越对象所在的行和列，得到新的模糊优先关系矩阵 1 x 2 R为 ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ 157. 060. 064. 046. 029. 0 43. 0154. 066. 059. 020. 0 40. 046. 0169. 044. 037. 0 36. 034. 031. 0147. 030. 0 54. 041. 056. 053. 0132. 0 71 . 0 80. 063. 070. 068. 01 2 R 取63. 0λ，得 R, 2 63. 0 ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ 100100 010100 001100 000100 000010 111111 λ-截矩阵 R 的第一行元素都等于 1, 应取 x２为第二优越对象。 2 63. 0 除去 R中第二优越对象 x2 所在的行与列，得到新的模糊优先关系矩阵 R为 23 R3 ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ 157. 060. 064. 046. 0 43. 0154. 066. 059. 0 40. 046. 0169. 044. 0 36. 034. 031. 0147. 0 54. 041. 056. 053. 01 , 取46. 0λ，得 R, 3 46. 0 ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ 11111 01111 01110 00011 10111 可知 x7 为第三优越对象。除去 R中第二优越对象 x７所在的行与列，得到新的模糊优先关系矩阵 R为 34 R4, ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ 154. 066. 059. 0 46. 0169. 044. 0 34. 031. 0147. 0 41. 056. 053. 01 取54. 0λ，得 R, 4 54. 0 ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ 1111 0110 0010 0101 可知 x6 为第四优越对象。类似地，可得R5为 R5, ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎝ ⎛ 169. 044. 0 31. 0147. 0 56. 053. 01 取53. 0λ，得 ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎝ ⎛ 110 010 111 5 53. 0 R 可知x3为第五优越对象，同样， ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ 169. 0 31. 01 6 R 取69. 0λ，得 ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ 11 01 6 69. 0 R 可知x5为第六优越对象，因此 7 名同学的排名为 x1, x2, x7, x6, x3, x5, x4