0

最近,我在使用 Apache Commons Lang 3 的 Java 代码库中遇到了以下哈希码“相等”场景,令我惊讶的是,我找不到太多关于如何处理这似乎是常见问题的信息:

MyObject one = new MyObject();
one.setFoo("foo");
one.setBar(null);

MyObject two = new MyObject();
two.setFoo("foo");
two.setBar((short) 0);

int oneHash = HashCodeBuilder.reflectionHashCode(one);
int twoHash = HashCodeBuilder.reflectionHashCode(two);

System.out.println("oneHash: " + oneHash);
System.out.println("twoHash: " + twoHash);
System.out.println("Bar equality: " + Objects.equals(one.getBar(), two.getBar()));

前面的代码产生以下输出,这表明两个对象具有相同的哈希码,尽管它们不相等:

oneHash: 3781511
twoHash: 3781511
Bar equality: false

我的对象定义:

public class MyObject {
    private String foo;
    private Short bar;

    public String getFoo() {
        return foo;
    }

    public void setFoo(String foo) {
        this.foo = foo;
    }

    public Short getBar() {
        return bar;
    }

    public void setBar(Short bar) {
        this.bar = bar;
    }
}

虽然我可以理解一个 null Numeric 和 0 Numeric 在纯数学意义上具有相同的散列,但在任何实际设置中,这都会导致不相等的对象具有相同的散列码,这可能会导致相当严重的冲突问题。

澄清/复杂化:虽然我希望能够只调用equals()hashcode()对象,但不幸的是,我正在使用的代码库正在比较两个Objects,这意味着我不知道是否equals()hashcode()实际上是为任何给定输入定义的,而且我在缺少这些方法的情况下,我无法编辑类定义以添加这些方法。这可能是该代码的原作者选择使用reflectionHashCode(). 考虑到这一点,是否有针对此问题的编程/基于代码的解决方案或解决方法,例如不需要equals()hashcode()在被比较的对象上定义的替代库?

4

2 回答 2

1

即使对于具有完全不同值的对象,也总是存在哈希码冲突的可能性。毕竟,您将无限数量的所有可能的对象值映射到一个 32 位整数。这仍然有效,因为利用了诸如集合和映射之类的代码的数据结构还.equals用于检查对象是否相等。

于 2020-04-17T22:14:18.717 回答
0

基于代码的解决方案是以区分 null 和 0 的方式实现哈希函数。有很多方法可以做到,这里有一个:

// this could be called hashCode, but you don't want to override hashCode
public int yourCustomHashFunction() {
    if (bar == null) {
        return Objects.hashCode(foo, 1234567);
    } else {
        return Objects.hashCode(foo, bar);
    }
}

由于bar是 a Short,因此 1234567 之类的有效范围之外的值short不太可能导致与有效短值发生冲突。

于 2020-04-17T22:15:00.830 回答