我最近遇到了 KMP 算法,我花了很多时间试图理解它为什么起作用。虽然我现在确实了解基本功能,但我根本无法理解运行时计算。
我从 geeksForGeeks 网站获取了以下代码:https ://www.geeksforgeeks.org/kmp-algorithm-for-pattern-searching/
该站点声称,如果文本大小为 O(n) 且模式大小为 O(m),则 KMP 会在最大 O(n) 时间内计算匹配。它还指出可以在 O(m) 时间内计算 LPS 数组。
// C++ program for implementation of KMP pattern searching
// algorithm
#include <bits/stdc++.h>
void computeLPSArray(char* pat, int M, int* lps);
// Prints occurrences of txt[] in pat[]
void KMPSearch(char* pat, char* txt)
{
int M = strlen(pat);
int N = strlen(txt);
// create lps[] that will hold the longest prefix suffix
// values for pattern
int lps[M];
// Preprocess the pattern (calculate lps[] array)
computeLPSArray(pat, M, lps);
int i = 0; // index for txt[]
int j = 0; // index for pat[]
while (i < N) {
if (pat[j] == txt[i]) {
j++;
i++;
}
if (j == M) {
printf("Found pattern at index %d ", i - j);
j = lps[j - 1];
}
// mismatch after j matches
else if (i < N && pat[j] != txt[i]) {
// Do not match lps[0..lps[j-1]] characters,
// they will match anyway
if (j != 0)
j = lps[j - 1];
else
i = i + 1;
}
}
}
// Fills lps[] for given patttern pat[0..M-1]
void computeLPSArray(char* pat, int M, int* lps)
{
// length of the previous longest prefix suffix
int len = 0;
lps[0] = 0; // lps[0] is always 0
// the loop calculates lps[i] for i = 1 to M-1
int i = 1;
while (i < M) {
if (pat[i] == pat[len]) {
len++;
lps[i] = len;
i++;
}
else // (pat[i] != pat[len])
{
// This is tricky. Consider the example.
// AAACAAAA and i = 7. The idea is similar
// to search step.
if (len != 0) {
len = lps[len - 1];
// Also, note that we do not increment
// i here
}
else // if (len == 0)
{
lps[i] = 0;
i++;
}
}
}
}
// Driver program to test above function
int main()
{
char txt[] = "ABABDABACDABABCABAB";
char pat[] = "ABABCABAB";
KMPSearch(pat, txt);
return 0;
}
我真的很困惑为什么会这样。
对于 LPS 计算,请考虑: aaaaaacaaac 在这种情况下,当我们尝试计算第一个 c 的 LPS 时,我们将继续返回,直到遇到 LPS[0],即 0 并停止。因此,本质上,我们将至少返回模式的长度直到该点。如果这种情况发生多次,时间复杂度将如何 O(m)?
我对 KMP 的运行时间有类似的困惑是 O(n)。
在发布之前,我已经阅读了堆栈溢出中的其他线程,以及有关该主题的各种其他站点。我仍然很困惑。如果有人可以帮助我了解这些算法的最佳和最坏情况以及如何使用一些示例计算它们的运行时间,我将不胜感激。再说一次,请不要建议我用谷歌搜索,我已经完成了,花了整整一周的时间试图获得任何见解,但失败了。