python - 通过属性比较对象实例是否相等

Question

我有一个类MyClass，其中包含两个成员变量foo和bar：

class MyClass:
    def __init__(self, foo, bar):
        self.foo = foo
        self.bar = bar

我有这个类的两个实例，每个实例都有相同的值foo和bar：

x = MyClass('foo', 'bar')
y = MyClass('foo', 'bar')

但是，当我比较它们是否相等时，Python 会返回False：

>>> x == y
False

我怎样才能让python认为这两个对象相等？

score 438 · Accepted Answer

您应该实现该方法__eq__：

class MyClass:
    def __init__(self, foo, bar):
        self.foo = foo
        self.bar = bar
        
    def __eq__(self, other): 
        if not isinstance(other, MyClass):
            # don't attempt to compare against unrelated types
            return NotImplemented

        return self.foo == other.foo and self.bar == other.bar

现在它输出：

>>> x == y
True

请注意，实现__eq__将自动使您的类的实例不可散列，这意味着它们不能存储在集合和字典中。如果您没有对不可变类型进行建模（即，如果属性foo和bar可能在对象的生命周期内更改值），那么建议将您的实例保留为不可散列。

如果您正在为不可变类型建模，您还应该实现数据模型挂钩__hash__：

class MyClass:
    ...

    def __hash__(self):
        # necessary for instances to behave sanely in dicts and sets.
        return hash((self.foo, self.bar))

一个通用的解决方案，比如循环__dict__和比较值的想法，是不可取的——它永远不可能是真正通用的，因为其中__dict__可能包含不可比较或不可散列的类型。

注意：请注意，在 Python 3 之前，您可能需要__cmp__使用__eq__. Python 2 用户可能还想实现__ne__，因为在 Python 2 中不会自动创建不等式的合理默认行为（即反转等式结果）。

score 52 · Accepted Answer

52

于 2009-08-04T12:15:43.480 回答

score 11 · Accepted Answer

如果您正在处理一个或多个无法从内部更改的类，则可以使用通用且简单的方法来执行此操作，这些方法也不依赖于特定于差异的库：

最简单、对非常复杂的对象不安全的方法

pickle.dumps(a) == pickle.dumps(b)

pickle是一个非常常见的 Python 对象序列化库，因此可以序列化几乎任何东西，真的。在上面的代码片段中，我将str序列化的 froma与from 进行比较b。与下一个方法不同，这个方法的优点是还可以对自定义类进行类型检查。

最大的麻烦：由于特定的排序和 [de/en] 编码方法，pickle对于相等的对象可能不会产生相同的结果，尤其是在处理更复杂的对象（例如嵌套自定义类实例的列表）时，就像您经常发现的那样在一些第三方库中。对于这些情况，我建议采用不同的方法：

彻底、对任何对象都安全的方法

您可以编写一个递归反射，为您提供可序列化的对象，然后比较结果

from collections.abc import Iterable

BASE_TYPES = [str, int, float, bool, type(None)]


def base_typed(obj):
    """Recursive reflection method to convert any object property into a comparable form.
    """
    T = type(obj)
    from_numpy = T.__module__ == 'numpy'

    if T in BASE_TYPES or callable(obj) or (from_numpy and not isinstance(T, Iterable)):
        return obj

    if isinstance(obj, Iterable):
        base_items = [base_typed(item) for item in obj]
        return base_items if from_numpy else T(base_items)

    d = obj if T is dict else obj.__dict__

    return {k: base_typed(v) for k, v in d.items()}


def deep_equals(*args):
    return all(base_typed(args[0]) == base_typed(other) for other in args[1:])

现在不管你的对象是什么，深度平等都可以保证工作

>>> from sklearn.ensemble import RandomForestClassifier
>>>
>>> a = RandomForestClassifier(max_depth=2, random_state=42)
>>> b = RandomForestClassifier(max_depth=2, random_state=42)
>>> 
>>> deep_equals(a, b)
True

可比对象的数量也无关紧要

>>> c = RandomForestClassifier(max_depth=2, random_state=1000)
>>> deep_equals(a, b, c)
False

我的用例是在 BDD 测试中检查一组不同的已经训练好的机器学习模型之间的深度相等性。这些模型属于一组不同的第三方库。当然__eq__，像这里建议的其他答案一样实施对我来说不是一个选择。

覆盖所有基地

您可能处于一个或多个被比较的自定义类没有__dict__实现的情况。这无论如何都不常见，但它是 sklearn 的随机森林分类器中的一个子类型的情况：<type 'sklearn.tree._tree.Tree'>. 根据具体情况处理这些情况 - 例如，具体而言，我决定将受影响类型的内容替换为一个方法的内容，该方法为我提供有关实例的代表性信息（在本例中为__getstate__方法）。因此，倒数第二行base_typed变成了

d = obj if T is dict else obj.__dict__ if '__dict__' in dir(obj) else obj.__getstate__()

编辑：为了组织起见，我将上面可怕的 oneliner 替换为return dict_from(obj). 在这里，dict_from是一个非常通用的反射，用于容纳更多晦涩的库（我在看着你，Doc2Vec）

def isproperty(prop, obj):
    return not callable(getattr(obj, prop)) and not prop.startswith('_')


def dict_from(obj):
    """Converts dict-like objects into dicts
    """
    if isinstance(obj, dict):
        # Dict and subtypes are directly converted
        d = dict(obj)

    elif '__dict__' in dir(obj):
        # Use standard dict representation when available
        d = obj.__dict__

    elif str(type(obj)) == 'sklearn.tree._tree.Tree':
        # Replaces sklearn trees with their state metadata
        d = obj.__getstate__()

    else:
        # Extract non-callable, non-private attributes with reflection
        kv = [(p, getattr(obj, p)) for p in dir(obj) if isproperty(p, obj)]
        d = {k: v for k, v in kv}

    return {k: base_typed(v) for k, v in d.items()}

请注意，对于具有不同顺序的相同键值对的对象，上述方法都不会产生，如True

>>> a = {'foo':[], 'bar':{}}
>>> b = {'bar':{}, 'foo':[]}
>>> pickle.dumps(a) == pickle.dumps(b)
False

sorted但是，如果您愿意，无论如何都可以事先使用 Python 的内置方法。

score 8 · Accepted Answer

在你的类中实现该__eq__方法；像这样的东西：

def __eq__(self, other):
    return self.path == other.path and self.title == other.title

编辑：如果您希望您的对象比较相等当且仅当它们具有相等的实例字典：

def __eq__(self, other):
    return self.__dict__ == other.__dict__

score 7 · Accepted Answer

使用Python 3.7（及更高版本）中的 Dataclasses，比较对象实例是否相等是一个内置功能。

数据类的反向移植可用于 Python 3.6。

(Py37) nsc@nsc-vbox:~$ python
Python 3.7.5 (default, Nov  7 2019, 10:50:52) 
[GCC 8.3.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> from dataclasses import dataclass
>>> @dataclass
... class MyClass():
...     foo: str
...     bar: str
... 
>>> x = MyClass(foo="foo", bar="bar")
>>> y = MyClass(foo="foo", bar="bar")
>>> x == y
True

score 5 · Accepted Answer

作为总结：

建议实现__eq__而不是__cmp__，除非您运行 python <= 2.0（__eq__已在 2.1 中添加）
不要忘记也实现__ne__（应该是类似return not self.__eq__(other)或return not self == other非常特殊的情况除外）
不要忘记，必须在您要比较的每个自定义类中实现运算符（参见下面的示例）。

如果要与可以为 None 的对象进行比较，则必须实现它。解释器无法猜到......（见下面的例子）

class B(object):
  def __init__(self):
    self.name = "toto"
  def __eq__(self, other):
    if other is None:
      return False
    return self.name == other.name

class A(object):
  def __init__(self):
    self.toto = "titi"
    self.b_inst = B()
  def __eq__(self, other):
    if other is None:
      return False
    return (self.toto, self.b_inst) == (other.toto, other.b_inst)

score 4 · Accepted Answer

根据您的具体情况，您可以执行以下操作：

>>> vars(x) == vars(y)
True

从对象的字段中查看Python 字典

score 1 · Accepted Answer

1

于 2009-08-04T12:13:58.830 回答

score 1 · Accepted Answer

您应该实现该方法__eq__：

 class MyClass:
      def __init__(self, foo, bar, name):
           self.foo = foo
           self.bar = bar
           self.name = name

      def __eq__(self,other):
           if not isinstance(other,MyClass):
                return NotImplemented
           else:
                #string lists of all method names and properties of each of these objects
                prop_names1 = list(self.__dict__)
                prop_names2 = list(other.__dict__)

                n = len(prop_names1) #number of properties
                for i in range(n):
                     if getattr(self,prop_names1[i]) != getattr(other,prop_names2[i]):
                          return False

                return True

score 0 · Accepted Answer

我写了这个并将它放在test/utils我项目的一个模块中。对于不是类的情况，只需计划 ol' dict，这将遍历两个对象并确保

每个属性都与其对应的属性相等
不存在悬空属性（仅存在于一个对象上的属性）

它很大……它并不性感……但是哦，它行得通！

def assertObjectsEqual(obj_a, obj_b):

    def _assert(a, b):
        if a == b:
            return
        raise AssertionError(f'{a} !== {b} inside assertObjectsEqual')

    def _check(a, b):
        if a is None or b is None:
            _assert(a, b)
        for k,v in a.items():
            if isinstance(v, dict):
                assertObjectsEqual(v, b[k])
            else:
                _assert(v, b[k])

    # Asserting both directions is more work
    # but it ensures no dangling values on
    # on either object
    _check(obj_a, obj_b)
    _check(obj_b, obj_a)

_assert您可以通过删除并仅使用普通的 ol' 来稍微清理它，assert但是当它失败时收到的消息非常无用。

score 0 · Accepted Answer

下面通过在两个对象层次结构之间进行深入比较来工作（在我的有限测试中）。In 处理各种情况，包括对象本身或其属性是字典的情况。

def deep_comp(o1:Any, o2:Any)->bool:
    # NOTE: dict don't have __dict__
    o1d = getattr(o1, '__dict__', None)
    o2d = getattr(o2, '__dict__', None)

    # if both are objects
    if o1d is not None and o2d is not None:
        # we will compare their dictionaries
        o1, o2 = o1.__dict__, o2.__dict__

    if o1 is not None and o2 is not None:
        # if both are dictionaries, we will compare each key
        if isinstance(o1, dict) and isinstance(o2, dict):
            for k in set().union(o1.keys() ,o2.keys()):
                if k in o1 and k in o2:
                    if not deep_comp(o1[k], o2[k]):
                        return False
                else:
                    return False # some key missing
            return True
    # mismatched object types or both are scalers, or one or both None
    return o1 == o2

这是一个非常棘手的代码，因此请在评论中添加任何可能不适合您的案例。

score 0 · Accepted Answer

class Node:
    def __init__(self, value):
        self.value = value
        self.next = None

    def __repr__(self):
        return str(self.value)

    def __eq__(self,other):
        return self.value == other.value

node1 = Node(1)
node2 = Node(1)

print(f'node1 id:{id(node1)}')
print(f'node2 id:{id(node2)}')
print(node1 == node2)

>>> node1 id:4396696848
>>> node2 id:4396698000
>>> True

score 0 · Accepted Answer

使用该setattr功能。当您无法在类本身中添加某些内容时，您可能想要使用它，例如，当您导入类时。

setattr(MyClass, "__eq__", lambda x, y: x.foo == y.foo and x.bar == y.bar)

score -1 · Accepted Answer

如果您想获得逐个属性的比较，并查看它是否以及在哪里失败，您可以使用以下列表推导：

[i for i,j in 
 zip([getattr(obj_1, attr) for attr in dir(obj_1)],
     [getattr(obj_2, attr) for attr in dir(obj_2)]) 
 if not i==j]

这里的额外好处是，在 PyCharm 中调试时，可以挤一行，在“Evaluate Expression”窗口中输入。

score -3 · Accepted Answer

我尝试了最初的示例（参见上面的 7），但它在 ipython 中不起作用。请注意，当使用两个相同的对象实例实现时， cmp(obj1,obj2) 返回“1”。奇怪的是，当我修改其中一个属性值并重新比较时，使用 cmp(obj1,obj2) 对象继续返回“1”。（叹...）

好的，所以您需要做的是迭代两个对象并使用 == 符号比较每个属性。

score -6 · Accepted Answer

与 == 比较时，类的实例不相等。最好的方法是将cmp函数分配给你的类，它会做这些事情。

如果你想通过内容进行比较，你可以简单地使用 cmp(obj1,obj2)

在您的情况下 cmp(doc1,doc2) 如果内容相同，它将返回 -1。

python - 通过属性比较对象实例是否相等

16 回答 16

最简单、对非常复杂的对象不安全的方法

彻底、对任何对象都安全的方法

覆盖所有基地

Related

Reference