是否有任何工具或实用程序或 perl/python 脚本可以在大型文本文件中找到最长的重复子字符串并打印这些模式以及每个模式出现的次数?
问问题
3010 次
1 回答
2
http://en.wikipedia.org/wiki/Longest_repeated_substring_problem:
最长重复子串问题是找到至少出现两次的字符串中最长的子串。这个问题可以通过为字符串构建后缀树,并在树中找到最深的内部节点,在线性时空上解决
python中的后缀树(虽然有点过时了..):http ://hkn.eecs.berkeley.edu/~dyoo/python/suffix_trees/
带有进一步解释的 Javascript 实现:http ://www.allisons.org/ll/AlgDS/Tree/Suffix/
于 2010-01-27T12:28:21.160 回答