我有一个大字典,其中的键是十进制,但是 System.Decimal 的 GetHashCode() 非常糟糕。为了证明我的猜测,我运行了一个包含 100.000 个相邻小数的 for 循环并检查了分布。100.000 个不同的十进制数字只使用了 2 个(两个!!!)不同的哈希码。
十进制表示为 16 个字节。就像吉德一样!但是 Guid 的 GetHashCode() 分布非常好。如何尽可能便宜地将小数转换为 C# 中的 Guid? 不安全的代码是可以的!
编辑:要求测试,所以这里是代码:
decimal d = 96000000000000000000m;
Dictionary<int, int> hashcount = new Dictionary<int, int>();
int length = 100000;
for (int i = 0; i < length; i++)
{
int hashcode = d.GetHashCode();
int n;
if (hashcount.TryGetValue(hashcode, out n))
{
hashcount[hashcode] = n + 1;
}
else
{
hashcount.Add(hashcode, 1);
}
d++;
}
Console.WriteLine(hashcount.Count);
这会打印 7。我不记得给我 2 的起始小数。