2

我有以下课程:

public class Foo
{
    int year;       
    string name;    
    int category;   
}

以下是一些示例数据:

2012    Test1   1000
2012    Test2   1000
2012    Test3   1000    
2012    Test4   1000
2012    Test4   10
...

如果我覆盖 GetHashCode 所有结果都非常相似:

return year ^ name ^ category;

int hash = 13;
    hash = hash * 33 + year.GetHashCode();
    hash = hash * 33 + name.GetHashCode();
    hash = hash * 33 + category.GetHashCode();
    return hash; 

对于这种情况,什么是好的散列函数(具有最大分布)?

编辑: 也许我对哈希桶的理解是错误的。将相似的哈希值放到同一个桶中?

"Test1".GetHashCode() --> -1556460260
"Test2".GetHashCode() --> -1556460257
4

1 回答 1

3

我推荐的一件事是检查 String对象是否为空

实现似乎很好,它会相似,但哈希码应该不同,因为主要目标是让它们落在不同的桶中,从而有助于进一步的操作。

   public int hashCode() {    // Assuming year and category are String like name.
    int hash = 31;
    hash = hash * 331 + (this.year != null ? this.year.GethashCode() : 0);
    hash = hash * 331 + (this.name != null ? this.name.GethashCode() : 0);
    hash = hash * 331 + (this.category != null ? this.category.GethashCode() : 0);

    return hash;
}

我在覆盖 hashCode 时学到的几个步骤是;

  1. 选择一个素数散列,例如 5、7、17 或 31(素数作为散列,导致不同对象的不同散列码)。
  2. 取另一个素数作为与哈希不同的乘数是好的。
  3. 计算每个成员的哈希码并将它们添加到最终哈希中。对参与平等的所有成员重复此操作。
  4. 返回哈希。
于 2013-08-08T13:27:25.990 回答