我正在使用 Python 的内置集合来保存我定义的类的对象。对于这个类,我定义了__eq__
、__ne__
和 ,__hash__
以便我可以通过我的自定义比较函数来比较对象。这很好用,直到我发现我实际上需要两组比较函数,它们将在我的代码中的不同时间以不同的方式使用。
我无法在我的类中定义两组__eq__
等方法,并且 Python 的内置 set 类型不接受比较器参数。我想我可以围绕 set 编写一个包装类,但这似乎比必要的工作多得多。
有没有比编写我自己的设置类更简单的解决方案?
我正在使用 Python 的内置集合来保存我定义的类的对象。对于这个类,我定义了__eq__
、__ne__
和 ,__hash__
以便我可以通过我的自定义比较函数来比较对象。这很好用,直到我发现我实际上需要两组比较函数,它们将在我的代码中的不同时间以不同的方式使用。
我无法在我的类中定义两组__eq__
等方法,并且 Python 的内置 set 类型不接受比较器参数。我想我可以围绕 set 编写一个包装类,但这似乎比必要的工作多得多。
有没有比编写我自己的设置类更简单的解决方案?
假设你有这个类:
class Thingy(object):
def __init__(self, key, notkey):
self.key, self.notkey = key, notkey
def __eq__(self, other):
return self.key == other.key
def __hash__(self):
return hash(self.key)
现在,您想将它们放在一个集合中,但用键notkey
代替key
. 您不能按原样执行此操作,因为集合期望其元素对相等具有一致的含义,并且对于 hash 也具有一致的含义,因此a == b
始终暗示hash(a) == hash(b)
. 因此,创建一个包装器:
class WrappedThingy(object):
def __init__(self, thingy):
self.thingy = thingy
def __eq__(self, other):
return self.thingy.notkey == other.thingy.notkey
def __hash__(self):
return hash(self.thingy.notkey)
你可以把它们放在一组中:
wts = set(WrappedThingy(thingy) for thingy in thingies)
例如,假设您想使您的事物唯一化,为每个notkey
值保留一个事物(任意)。只需将它们包装起来,将包装纸粘贴在一组中,然后打开它们并将未包装的粘贴在一个列表中:
wts = set(WrappedThingy(thingy) for thingy in thingies)
thingies = [wt.thingy for wt in wts]
这是更通用的 Python 模式的一部分,称为“DSU”。这代表“decorate-sort-undecorate”,现在它非常不准确,因为在现代 Python 中几乎不需要它来处理与排序相关的任务……但从历史上看,它是有道理的。随意将其称为“装饰-过程-取消装饰”,希望它会流行起来,但不要抱太大希望。
现在不需要 DSU 进行排序的原因是大多数排序函数都将key
函数作为参数。事实上,即使是为了唯一性, recipesunique_everseen
中的函数也需要一个.itertools
key
但如果你看看它在幕后做了什么,它基本上就是 DSU:
for element in iterable:
k = key(element)
if k not in seen:
seen.add(k)
yield element
(事实上它是一个生成器而不是一个列表构建函数,这意味着它可以“即时取消装饰”,这使得事情变得更简单。但除此之外,同样的想法。)