5

如果我理解正确,调用对象的 __cmp__() 函数是为了评估集合中的所有对象,同时确定对象是否是集合的成员或“在”集合中。但是,这似乎不是集合的情况:

class MyObject(object):
    def __init__(self, data):
        self.data = data

    def __cmp__(self, other):
        return self.data-other.data

a = MyObject(5)
b = MyObject(5)

print a in [b]          //evaluates to True, as I'd expect
print a in set([b])     //evaluates to False

那么,如何在集合中测试对象成员资格?

4

4 回答 4

5

向您的类添加__hash__方法会产生以下结果:

class MyObject(object):
    def __init__(self, data):
        self.data = data

    def __cmp__(self, other):
        return self.data - other.data

    def __hash__(self):
        return hash(self.data)


a = MyObject(5)
b = MyObject(5)

print a in [b] # True
print a in set([b]) # Also True!
于 2010-09-09T18:45:30.390 回答
2
>>> xs = []
>>> set([xs])
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: unhashable type: 'list'

你在这。集合使用哈希,与字典非常相似。这对性能非常有帮助(成员资格测试是 O(1),并且许多其他操作都依赖于成员资格测试),并且它也很好地符合集合的语义:集合项必须是唯一的,不同的项会产生不同的哈希,而相同的哈希指出(好吧,理论上)重复。

由于默认值__hash__是 just id(恕我直言,这是相当愚蠢的),继承object's的类的两个实例__hash__永远不会散列到相同的值(好吧,除非地址空间大于sizeof散列)。

于 2010-09-09T18:42:18.770 回答
1

正如其他人指出的那样,您的对象没有,__hash__因此它们使用默认 id 作为哈希,您可以按照 Nathon 的建议覆盖它,请阅读有关 的文档__hash__,特别是关于何时应该和不应该这样做的要点。

于 2010-09-09T18:57:38.513 回答
0

集合在幕后使用字典,因此“in”语句检查对象是否作为字典中的键存在。由于您的对象没有实现散列函数,因此对象的默认散列函数使用对象的 id。因此,即使 a 和 b 是等价的,它们也不是同一个对象,这就是正在测试的内容。

于 2010-09-09T18:40:24.310 回答