6

List<byte> lbyte 

byte[] searchBytes

如何搜索 lbyte 不仅是单个字节,而且是 searchBytes 的索引?
例如

Int32 index = lbyte.FirstIndexOf(searchBytes);

这是我想出的蛮力。
不是我正在寻找的性能。

public static Int32 ListIndexOfArray(List<byte> lb, byte[] sbs)
{
    if (sbs == null) return -1;
    if (sbs.Length == 0) return -1;
    if (sbs.Length > 8) return -1;
    if (sbs.Length == 1) return lb.FirstOrDefault(x => x == sbs[0]);
    Int32 sbsLen = sbs.Length;
    Int32 sbsCurMatch = 0;
    for (int i = 0; i < lb.Count; i++)
    {
        if (lb[i] == sbs[sbsCurMatch])
        {
            sbsCurMatch++;
            if (sbsCurMatch == sbsLen)
            {
                //int index = lb.FindIndex(e => sbs.All(f => f.Equals(e)));  // fails to find a match
                IndexOfArray = i - sbsLen + 1;
                return;
            }
        }
        else 
        {
            sbsCurMatch = 0;
        }
    }
    return -1;
}
4

3 回答 3

4

蛮力总是一种选择。尽管与其他一些方法相比速度较慢,但​​在实践中通常并不算太糟糕。lbyte如果不是很大并且没有病理数据,它很容易实现并且完全可以接受。

这与蛮力字符串搜索的概念相同。

于 2013-04-20T00:16:49.683 回答
3

您可能会发现Boyer-Moore 算法在这里很有用。将您的列表转换为数组并搜索。算法代码取自这篇文章

static int SimpleBoyerMooreSearch(byte[] haystack, byte[] needle)
{
    int[] lookup = new int[256];
    for (int i = 0; i < lookup.Length; i++) { lookup[i] = needle.Length; }

    for (int i = 0; i < needle.Length; i++)
    {
        lookup[needle[i]] = needle.Length - i - 1;
    }

    int index = needle.Length - 1;
    var lastByte = needle.Last();
    while (index < haystack.Length)
    {
        var checkByte = haystack[index];
        if (haystack[index] == lastByte)
        {
            bool found = true;
            for (int j = needle.Length - 2; j >= 0; j--)
            {
                if (haystack[index - needle.Length + j + 1] != needle[j])
                {
                    found = false;
                    break;
                }
            }

            if (found)
                return index - needle.Length + 1;
            else
                index++;
        }
        else
        {
            index += lookup[checkByte];
        }
    }
    return -1;
}

然后你可以像这样搜索。如果lbyte在一定时间后保持不变,您只需将其转换为数组并传递它。

//index is returned, or -1 if 'searchBytes' is not found
int startIndex = SimpleBoyerMooreSearch(lbyte.ToArray(), searchBytes);

根据评论更新。这是IList实现,这意味着数组和列表(以及IList可以传递的任何其他实现)

 static int SimpleBoyerMooreSearch(IList<byte> haystack, IList<byte> needle)
 {
    int[] lookup = new int[256];
    for (int i = 0; i < lookup.Length; i++) { lookup[i] = needle.Count; }

    for (int i = 0; i < needle.Count; i++)
    {
        lookup[needle[i]] = needle.Count - i - 1;
    }

    int index = needle.Count - 1;
    var lastByte = needle[index];
    while (index < haystack.Count)
    {
        var checkByte = haystack[index];
        if (haystack[index] == lastByte)
        {
            bool found = true;
            for (int j = needle.Count - 2; j >= 0; j--)
            {
                if (haystack[index - needle.Count + j + 1] != needle[j])
                {
                    found = false;
                    break;
                }
            }

            if (found)
                return index - needle.Count + 1;
            else
                index++;
        }
        else
        {
            index += lookup[checkByte];
        }
    }
    return -1;
}

由于数组和列表实现了 IList,因此在您的情况下调用它时无需进行转换。

int startIndex = SimpleBoyerMooreSearch(lbyte, searchBytes);
于 2013-04-20T00:24:23.910 回答
1

您可以使用 lambda 表达式的另一种方法

int index = lbyte.FindIndex(e => searchBytes.All(i => i.Equals(e));
于 2013-04-20T00:39:00.223 回答