1

我正在为以下场景寻找一个集合类:

  • 快速集合查找,一次一项。
  • 该集合包含大约 300 K 项。
  • 收集人口速度可能并不重要,但理想情况下也很快。
  • 加载集合后无需更新/删除/插入

Ip2Location将填充到集合中的类型项目示例:

public class Ip2Location
{
   public long IpFrom {get; set;}
   public long IpTo {get; set;}
   public string Country {get; set;}  
}

IpFrom      IpTo        Country
16909056    16909311    AU
16909312    16941055    US

针对集合的项目查找是通过指定的 IP 完成的,如下所示:

IpFrom < currentIp < IpTo

任何想法,包括参考链接,将不胜感激!

比较:HashSet, SortedSet

有没有更好的收藏类?

参考:下面链接中的对照表:http: //geekswithblogs.net/BlackRabbitCoder/archive/2011/06/16/c.net-fundamentals-choosing-the-right-collection-class.aspx

更新

使用 Array.BinarySearch 的问题:

var index = Array.BinarySearch(ipCountries, new IpCountry { IpFrom = 16909056}, new Ip2LocationComparer());

它适用于少量行,不适用于 300k 项(例如索引为 -(totalrow+1) )。搜索项目加载在 300 K 项目集合中。

        public class Ip2LocationComparer: IComparer<IpCountry>
        {
            public int Compare(IpCountry x, IpCountry y)
            {
                if (x != null && y != null)
                    return (x.IpFrom <= y.IpFrom && y.IpFrom <= x.IpTo)? 0 : -1;

                return -1;

            }
        }

更新 2

我把它改成下面

public class Ip2LocationComparer: IComparer<IpCountry>
            {
                public int Compare(IpCountry x, IpCountry y)
                {
       if (x != null && y != null)

            {
                if (x.IpFrom > y.IpFrom)
                    return 1;

                if (x.IpFrom < y.IpFrom)
                    return -1;

                if (x.IpFrom == y.IpFrom)
                {
                    if (y.IpFrom > x.IpTo)
                        return 1;

                    if (y.IpFrom < x.IpTo)
                        return -1;

                }

            }

            return 0;
}

但是 BinarySearch 的索引返回仍然是负数,正好在匹配项和后续项之间。例如,如果我的搜索 IpFrom 为 3,则索引在 2 和 4 之间。为什么它不返回 2?我还没有测试 IpTo 场景。

任何想法将不胜感激!

4

2 回答 2

4

您可以将其存储在数组中。

如果您在填充后对数组进行排序,那么BinarySearch将是一种非常快速的方法来查找您的currentIp跌落位置。

于 2013-02-07T23:17:46.390 回答
0

数据结构方面,您可以尝试使用字典或排序列表,尽管有 300000 个项目,您可能会遇到问题。不过,我很想知道结果。带有 BinarySearch 的普通数组也可能不是一个坏选择。

您还可以考虑利用机器上的所有内核进行快速查找。您可以在大多数集合上使用.AsParallel() 扩展方法,这将为在多个核心上查询的集合做好准备。

于 2013-02-07T23:20:51.297 回答