专栏名称: 吴师兄学算法

和程序员小吴一起从初学者的角度学习算法，以动画的形式呈现解题的思路。每周四篇原创文章，期待你的鉴赏！

目录

相关文章推荐

爱可可-爱生活 · 【FLORA：一场彻底改变工作流的革命！核心 ... · 昨天

量子位 · DeepSeek今日连开3源！针对优化的并行 ... · 昨天

新智元 · Claude 3.7 ... · 2 天前

爱可可-爱生活 · 【[89星]SlamKit：专门为了提高语音 ... · 2 天前

爱可可-爱生活 · 本文创新性地提出循环Transformer架 ... · 3 天前

51好读 › 专栏 › 吴师兄学算法

动画：BM 算法中的坏字符规则与好后缀规则

吴师兄学算法 · 公众号 · · 2019-08-16 12:15

正文

点击蓝色“ 五分钟学算法 ”关注我哟

加个“ 星标 ”，天天中午 12:15，一起学算法

1977 年，德克萨斯大学的 Robert S. B oyer 教授和 J Strother M oore 教授发明了一种新的字符串匹配算法： Boyer-Moore 算法，简称 BM 算法 。

该算法 从模式串的尾部开始匹配 ，且拥有在最坏情况下 O(N) 的时间复杂度。有数据表明，在实践中，比 KMP 算法的实际效能高，可以快大概 3-5 倍。

BM 算法中有两个核心规则，本文主要介绍这两个规则。

定义

BM算法 的一个特点是当不匹配的时候 一次性可以跳过不止一个字符 。即它不需要对被搜索的字符串中的字符进行逐一比较，而会跳过其中某些部分。通常搜索关键字越长，算法速度越快。它的效率来自于这样的事实：对于每一次失败的匹配尝试，算法都能够使用这些信息来排除尽可能多的无法匹配的位置。

它充分利用待搜索字符串的 一些特征 ，加快了搜索的步骤。

那它是利用了什么特性去 排除尽可能多的无法匹配的位置 呢？

它是基于以下两个规则让模式串每次向右移动 尽可能大 的距离。

坏字符规则（ bad-character shift ）：当文本串中的某个字符跟模式串的某个字符不匹配时，我们称文本串中的这个失配字符为坏字符，此时模式串需要向右移动，移动的位数 = 坏字符在模式串中的位置 - 坏字符在模式串中最右出现的位置。此外，如果"坏字符"不包含在模式串之中，则最右出现位置为 -1。 坏字符针对的是文本串。
好后缀规则（ good-suffix shift ）：当字符失配时，后移位数 = 好后缀在模式串中的位置 - 好后缀在模式串上一次出现的位置，且如果好后缀在模式串中没有再次出现，则为 -1。 好后缀针对的是模式串。

坏字符规则

坏字符出现的时候有两种情况进行讨论。

1、 模式串中没有出现了文本串中的那个坏字符 ，将模式串直接整体对齐到这个字符的后方，继续比较。

2、模式串中有对应的坏字符时，让模式串中 最靠右 的对应字符与坏字符相对。

这句话有一个关键词是 最靠右 。

思考一下为什么是 最靠右 ？

看图！

好后缀规则

1、如果模式串中存在已经匹配成功的好后缀，则把目标串与好后缀对齐，然后从模式串的最尾元素开始往前匹配。

2、如果无法找到匹配好的后缀，找一个匹配的最长的前缀，让目标串与最长的前缀对齐（如果这个前缀存在的话）。 模式串[m-s，m] = 模式串[0，s] 。

3、如果完全不存在和好后缀匹配的子串，则右移整个模式串。

请到「今天看啥」查看全文

推荐文章

爱可可-爱生活 · 【FLORA：一场彻底改变工作流的革命！核心价值：将原本需要3小-20250227120842

昨天

量子位 · DeepSeek今日连开3源！针对优化的并行策略，梁文峰本人参与开发

昨天

新智元 · Claude 3.7 Sonnet游戏里贪吃蛇惊现自我意识？发现自己是代码绝望崩溃

2 天前

爱可可-爱生活 · 【[89星]SlamKit：专门为了提高语音语言模型训练效率而设-20250226124411

2 天前

爱可可-爱生活 · 本文创新性地提出循环Transformer架构，论证了深度对于推-20250226055758

3 天前

世界音乐 · 『一半是火焰,一半是海水』古巴双生姐妹花

8 年前

钱江晚报 · 最新！杭州楼市2016年度最全榜单出炉，你家上榜了吗？

8 年前

哲学园 · 身上插满特朗普的刀，科米从容讲述他的故事

7 年前

爱股君2020 · 【前瞻】8月4日淘金早参：操盘策略+热点追踪（附股）

7 年前

缓缓说 · 我喜欢胖一点的女生

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!