8

有很多关于字符串算法的帖子:

但是,没有提到一般文献。

谁能推荐一本可以彻底探索各种字符串算法的书?特别感兴趣的主题是近似字符串匹配[例如谷歌提供的更正搜索字符串变体:)]。

非常感谢您的建议。

4

5 回答 5

8

我很惊讶没有人提到 Dan Gusfield 的优秀著作《关于字符串、树和序列的算法》 ,它比任何人都可能需要的更详细地介绍了字符串算法。它对我几年前从事的蛋白质测序项目非常有用。阅读本书后,您将了解到:

  • 朴素的字符串匹配
  • 基于预处理器的算法 (Boyer Moore, Knuth-Morris-Pratt)
  • 正则表达式匹配算法
  • Karp-Rabin 和类似方法
  • 后缀树方法(Ukkonen 方法等)
  • 序列比对(Levenshtein 距离和字符串相似性,以及多序列比对)
  • 应用于DNA测序、基因预测等领域。
于 2010-05-11T19:01:05.977 回答
2

这不是一本书推荐,但这个库和站点是一个提供大量高效字符串匹配算法实现的库:

http://www.dcs.shef.ac.uk/~sam/simmetrics.html

它还为每个人提供了进一步学习的链接,以及每个人最适用的地方。

于 2010-05-11T18:50:16.833 回答
2

弦学珠宝

于 2010-05-11T20:48:15.653 回答
1

CLR有一些字符串处理算法,但不是专门针对它们的。

包含:

于 2010-05-11T18:33:56.690 回答
1

TRE是一个实现近似匹配的开源库。About 页面有一些关于它如何工作的有趣提示,尽管我不确定它是否提供了您正在寻找的那种深入分析。从这个角度来看,源代码可能更具启发性。

于 2010-05-11T18:44:59.663 回答