1

我正在使用这个程序来计算后缀数组和最长公共前缀。

我需要计算两个字符串之间的最长公共子字符串。

为此,我连接字符串,A#B然后使用这个算法

我有后缀数组sa[]LCP[]数组。

LCP[]最长的公共子串是数组的最大值。

为了找到子串,唯一的条件是在相同长度的子串中,字符串B中第一次出现的那个应该是答案。

为此,我维持 LCP[] 的最大值。如果LCP[curr_index] == max,那么我确保left_index子字符串 B 的 小于 的先前值left_index

但是,这种方法并没有给出正确的答案。错在哪里?

max=-1;
for(int i=1;i<strlen(S)-1;++i)
{
    //checking that sa[i+1] occurs after s[i] or not
    if(lcp[i] >= max && sa[i] < l1 && sa[i+1] >= l1+1 )
    {
        if( max == lcp[i] && sa[i+1] < left_index ) left_index=sa[i+1];

        else if (lcp[i] > ma )
        {
            left_index=sa[i+1];
            max=lcp[i];
        }
    }
    //checking that sa[i+1] occurs after s[i] or not
    else if (lcp[i] >= max && sa[i] >= l1+1 && sa[i+1] < l1 )
    {
        if( max == lcp[i] && sa[i] < left_index) left_index=sa[i];

        else if (lcp[i]>ma)
        {
            left_index=sa[i];
            max=lcp[i];
        }
    }
}
4

1 回答 1

1

AFAIK,这个问题来自一个编程竞赛,在社论发布之前讨论正在进行的竞赛的编程问题不应该是......虽然我给你一些见解,因为我得到了带有后缀数组的错误答案。然后我使用了后缀 Automaton,它让我接受了。

后缀数组适用于,O(nlog^2 n)而后缀自动机适用于O(n). 所以我的建议是使用后缀 Automaton,你肯定会被接受。如果您可以为该问题编写解决方案,您肯定会编写此代码。

在 codchef 论坛中还发现:

Try this case 
babaazzzzyy 
badyybac 
The suffix array will contain baa... (From 1st string ) , baba.. ( from first string ) , bac ( from second string ) , bad from second string .
So if you are examining consecutive entries of SA then you will find a match at "baba" and "bac" and find the index of "ba" as 7 in second string , even though its actually at index 1 also . 
Its likely that you may output "yy" instead of "ba"

并且还处理约束......在第二个字符串上找到的第一个最长的公共子字符串,应该写入输出......在后缀自动机的情况下将非常容易。祝你好运!

于 2014-03-17T02:16:53.197 回答