专栏名称: 懒成铁
Web前端工程师
51好读  ›  专栏  ›  懒成铁

【重学数据结构与算法(JS)】字符串匹配算法(四)——Sunday算法

懒成铁  · 掘金  ·  · 2020-01-24 00:33

正文

阅读 21

【重学数据结构与算法(JS)】字符串匹配算法(四)——Sunday算法

前言

惯例,最重要的匹配思路还是要贴一遍:

  1. 模式串 主串 进行比较
    • 从前往后比较
    • 从后往前比较
  2. 匹配时,比较 主串 模式串 的下一个位置
  3. 失配时,
    • 模式串 中寻找一个合适的位置
      • 如果找到,从这个位置开始与 主串 当前失配位置进行比较
      • 如果未找到,从 模式串 的头部与 主串 失配位置的下一个位置进行比较
    • 主串 中找到一个合适的位置,重新与 模式串 进行比较

Sunday算法 也许是三种里面最好理解也最好写的一种了,它的思路也是在于 失配时如何跳过尽可能多的字符 ,具体的说,主要是优化了第3步, 失配时,在 主串 中找到一个合适的位置,重新与 模式串 进行比较

算法介绍与分析

  • 主串 模式串 的首位开始比较,记
    • 主串 S
    • 模式串 P
    • 主串长度 slen
    • 模式串长度 plen
    • 主串位置指针 i
    • 模式串位置指针 j
    • 每次重新匹配时,模式串尾部对应主串位置的下一位 m
  • 判断 S[i] P[j] 是否相等
    • 如果相等
      • 判断 j plen-1 是否相等,如果相等则表示 表示模式串匹配完成,直接返回 i - j 即可
      • 如果不相等,则继续比较下一位,即 i++;j++;
    • 如果不相等
      • 查看 S[m] 字符是否存在于 P 中,如果存在,将 P 移至两字符对应的位置上
      • 如果不存在,则移至 S[m] 的后一位
  • 如果移动后, m > slen ,说明 S 已经遍历一遍,仍然没有找到目标, 模式串 匹配失败。

栗子

初始状态, i = 0, j = 0, m = 4


比较 S[0] P[0] ,发现不相等,看 S[4] 处发现并没有在 P 中出现


直接将 P 移至 S[4] 的后一位,此时 i = 5, j = 0, m = 9


比较 S[5] P[0] ,发现不相等,看 S[9] 处发现有在 P 中出现


P 中的 i S 中的 i 对齐,此时 i = 8, j = 0, m = 12


比较 S[8] P[0] ,发现不相等,看 S[12] 处发现并没有在 P 中出现


直接将 P 移至 S[12] 的后一位,此时 i = 13, j = 0, m = 17


比较 S[13] P[0] ,发现不相等,看 S[17] 处发现有在 P 中出现


P 中的 n S 中的 n 对齐,此时 i = 15, j = 0, m = 18







请到「今天看啥」查看全文