56

这很奇怪。一位同事询问了 java 中 myArray.hashCode() 的实现。我以为我知道,但后来我进行了一些测试。检查下面的代码。我注意到的奇怪的事情是,当我写出第一个系统时,结果是不同的。请注意,它几乎就像是在报告内存地址并修改类移动地址或其他东西。只是想我会分享。

int[] foo = new int[100000];
java.util.Random rand = new java.util.Random();

for(int a = 0; a < foo.length; a++) foo[a] = rand.nextInt();

int[] bar = new int[100000];
int[] baz = new int[100000];
int[] bax = new int[100000];
for(int a = 0; a < foo.length; a++) bar[a] = baz[a] = bax[a] = foo[a];

System.out.println(foo.hashCode() + " ----- " + bar.hashCode() + " ----- " + baz.hashCode() +  " ----- " + bax.hashCode());

// returns 4097744 ----- 328041 ----- 2083945 ----- 2438296
// Consistently unless you modify the class.  Very weird
// Before adding the comments below it returned this:
// 4177328 ----- 4097744 ----- 328041 ----- 2083945


System.out.println("Equal ?? " +
  (java.util.Arrays.equals(foo, bar) && java.util.Arrays.equals(bar, baz) &&
  java.util.Arrays.equals(baz, bax) && java.util.Arrays.equals(foo, bax)));
4

4 回答 4

96

java.lang.Array hashCode方法继承自Object,这意味着哈希码取决于引用。要根据数组的内容获取哈希码,请使用Arrays.hashCode.

请注意它是一个浅哈希码实现。还存在一个深度实现Arrays.deepHashCode

于 2009-04-13T17:46:31.243 回答
6

数组使用基于内存位置的默认哈希码(但不一定内存位置,因为它只是一个int并且所有内存地址都不适合)。您还可以通过打印System.identityHashCode(foo).

只有equal当它们是相同的、相同的数组时,数组才是。所以,数组哈希码只有在它们是相同的、相同的数组的情况下才会相等。

于 2009-04-13T17:48:06.437 回答
1

Object.hashCode() 的默认实现确实是返回对象的指针值,尽管这取决于实现。例如,一个 64 位 JVM 可以将指针和 XOR 以及高位和低位字放在一起。如果有意义,鼓励子类覆盖此行为。

但是,对可变数组执行相等比较是没有意义的。如果一个元素发生变化,那么两者就不再相等。为了保持相同的数组将始终返回相同的 hashCode 无论其元素发生什么的不变性,数组不会覆盖默认的 hashcode 行为。

请注意,java.util.Arrays 提供了一个 deepHashCode() 实现,以便在基于数组内容而不是数组本身的标识进行散列时很重要。

于 2009-04-13T18:00:19.790 回答
1

我同意使用 java.util.Arrays.hashCode(或 google guava 通用包装器 Objects.hashcode),但请注意,如果您使用 Terracotta,这可能会导致问题 - 请参阅此链接

于 2010-10-27T02:46:34.057 回答