我最近遇到一个面试问题:要找到给定字符串中最小大小为 2 的所有重复子字符串。该算法应该是有效的。
下面给出了上述问题的代码,但它不是有效的。
#include <iostream>
#include <algorithm>
#include <iterator>
#include <set>
#include <string>
using namespace std;
int main()
{
typedef string::const_iterator iterator;
string s("ABCFABHYIFAB");
set<string> found;
if (2 < s.size())
for (iterator i = s.begin() + 1, j = s.end(); i != j; ++i)
for (iterator x = s.begin(); x != i; ++x)
{
iterator tmp = mismatch(i, j, x).second;;
if (tmp - x > 1)
found.insert(string(x, tmp));
}
copy(found.begin(), found.end(),ostream_iterator<string>(cout, "\n"));
}
我的问题是,是否有任何数据结构可以以 O(N) 的时间复杂度实现上述问题?
如果您的答案是后缀树或散列,请详细说明。