1

我正在编写一个 N 阶马尔可夫链。

它是这样的:

class Chain:
 def __init__(self, order):
  self.order = order
  self.state_table = {}
 def train(self, next_state, *prev_states):
  if len(prev_states) != self.order: raise ValueError("prev_states does not match chain order")
  if prev_states in self.state_table:
   if next_state in self.state_table[prev_states]:
    self.state_table[prev_states][next_state] += 1
   else:
    self.state_table[prev_states][next_state] = 0
  else:
   self.state_table[prev_states] = {next_state: 0}

不幸的是,列表和元组是不可散列的,我不能将它们用作字典中的关键字......我希望我已经很好地解释了我的问题,让你理解我试图实现的目标。

有什么好主意如何为字典关键字使用多个值?

后续问题:

我不知道元组是可散列的。但是哈希的熵似乎很低。元组可能存在哈希冲突吗?

4

2 回答 2

6

元组的内容是散列的。

>>> a = {}
>>> a[(1,2)] = 'foo'
>>> a[(1,[])]
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: unhashable type: 'list'

至于碰撞,当我尝试一堆非常相似的元组时,我看到它们被映射得很远:

>>> hash((1,2))
3713081631934410656
>>> hash((1,3))
3713081631933328131
>>> hash((2,2))
3713082714462658231
>>> abs(hash((1,2)) - hash((1,3)))
1082525
>>> abs(hash((1,2)) - hash((2,2)))
1082528247575
于 2011-12-30T11:58:12.930 回答
3

您可以将元组用作字典键,只要它们的内容是可散列的(正如@larsman 所说),它们就是可散列的。

不用担心碰撞,Python 的 dict 会处理它。

>>> hash('a')
12416037344
>>> hash(12416037344)
12416037344
>>> hash('a') == hash(12416037344)
True
>>> {'a': 'one', 12416037344: 'two'}
{'a': 'one', 12416037344: 'two'}

在这个例子中,我使用了一个字符串和一个整数。但它对元组的工作方式相同。只是不知道如何找到两个具有相同哈希的元组。

于 2011-12-30T12:09:17.683 回答