TL;DR:考虑Hash#compare_by_indentity
您需要决定是否希望散列按数组值或数组标识工作。
默认情况下,数组.hash
和.eql?
值,这就是为什么更改值会使 ruby 感到困惑。考虑你的例子的这个变体:
pry(main)> a = [1, 2]
pry(main)> a1 = [1]
pry(main)> a.hash
=> 4266217476190334055
pry(main)> a1.hash
=> -2618378812721208248
pry(main)> h = {a => '12', a1 => '1'}
=> {[1, 2]=>"12", [1]=>"1"}
pry(main)> h[a]
=> "12"
pry(main)> a.delete_at(1)
pry(main)> a
=> [1]
pry(main)> a == a1
=> true
pry(main)> a.hash
=> -2618378812721208248
pry(main)> h[a]
=> "1"
看看那里发生了什么?正如您所发现的,它无法匹配a
键,因为.hash
它存储它的值已过时[顺便说一句,您甚至不能依赖它!突变可能导致相同的哈希(罕见)或落在同一桶中的不同哈希(不是那么罕见)。]
但不是通过返回失败,而是在键nil
上匹配。
看,根本不在乎vs的身份(叛徒!)。它将您提供的当前值与存在的值进行比较并找到匹配项。a1
h[a]
a
a1
[1]
a1
[1]
这就是为什么使用.rehash
只是创可贴。它将重新计算.hash
所有键的值并将它们移动到正确的存储桶中,但它很容易出错,并且还可能导致麻烦:
pry(main)> h.rehash
=> {[1]=>"1"}
pry(main)> h
=> {[1]=>"1"}
哦哦。这两个条目合并为一个,因为它们现在具有相同的值(很难预测哪个获胜)。
解决方案
一种明智的方法是采用按值查找,这要求值永远不会改变。 .freeze
你的钥匙。或者在构建散列时使用.clone
/ .dup
,并随意改变原始数组 - 但接受这将根据构建时保留的值h[a]
查找当前值。a
另一个,你似乎想要的,是决定你关心身份——查找a
应该找到a
它的当前值,并且许多键是否具有或现在具有相同的值并不重要。
如何?
Object
按身份哈希。(数组不是因为.==
按值的类型也倾向于覆盖.hash
并按.eql?
值。)所以一种选择是:不要使用数组作为键,使用一些自定义类(其中可能包含一个数组)。
但是,如果您希望它直接表现得像数组散列一样怎么办?您可以子类化 Hash 或 Array,但要使一切工作一致,需要做很多工作。幸运的是,Ruby 有一个内置的方法:h.compare_by_identity
将哈希切换为通过身份工作(无法撤消,AFAICT)。如果在插入任何内容之前执行此操作,您甚至可以拥有具有相同值的不同键,而不会造成混淆:
[39] pry(main)> x = [1]
=> [1]
[40] pry(main)> y = [1]
=> [1]
[41] pry(main)> h = Hash.new.compare_by_identity
=> {}
[42] pry(main)> h[x] = 'x'
=> "x"
[44] pry(main)> h[y] = 'y'
=> "y"
[45] pry(main)> h
=> {[1]=>"x", [1]=>"y"}
[46] pry(main)> x.push(7)
=> [1, 7]
[47] pry(main)> y.push(7)
=> [1, 7]
[48] pry(main)> h
=> {[1, 7]=>"x", [1, 7]=>"y"}
[49] pry(main)> h[x]
=> "x"
[50] pry(main)> h[y]
=> "y"
请注意,如果您尝试将此类散列放在那里,例如 strings ,则此类散列是违反直觉的,因为我们确实习惯于按值散列的字符串。