5

我正在尝试为只读对象编写一个类,该对象不会真正与copy模块一起复制,并且当它被腌制以在进程之间传输时,每个进程将保持不超过一个副本,无论如何很多时候,它将作为“新”对象传递。已经有类似的东西了吗?

4

3 回答 3

2

我试图实现这一点。@Alex Martelli 和其他任何人,请给我评论/改进。我认为这最终会出现在 GitHub 上。

"""
todo: need to lock library to avoid thread trouble?

todo: need to raise an exception if we're getting pickled with
an old protocol?

todo: make it polite to other classes that use __new__. Therefore, should
probably work not only when there is only one item in the *args passed to new.

"""

import uuid
import weakref

library = weakref.WeakValueDictionary()

class UuidToken(object):
    def __init__(self, uuid):
        self.uuid = uuid


class PersistentReadOnlyObject(object):
    def __new__(cls, *args, **kwargs):
        if len(args)==1 and len(kwargs)==0 and isinstance(args[0], UuidToken):
            received_uuid = args[0].uuid
        else:
            received_uuid = None

        if received_uuid:
            # This section is for when we are called at unpickling time
            thing = library.pop(received_uuid, None)
            if thing:
                thing._PersistentReadOnlyObject__skip_setstate = True
                return thing
            else: # This object does not exist in our library yet; Let's add it
                new_args = args[1:]
                thing = super(PersistentReadOnlyObject, cls).__new__(cls,
                                                                     *new_args,
                                                                     **kwargs)
                thing._PersistentReadOnlyObject__uuid = received_uuid
                library[received_uuid] = thing
                return thing

        else:
            # This section is for when we are called at normal creation time
            thing = super(PersistentReadOnlyObject, cls).__new__(cls, *args,
                                                                 **kwargs)
            new_uuid = uuid.uuid4()
            thing._PersistentReadOnlyObject__uuid = new_uuid
            library[new_uuid] = thing
            return thing

    def __getstate__(self):
        my_dict = dict(self.__dict__)
        del my_dict["_PersistentReadOnlyObject__uuid"]
        return my_dict

    def __getnewargs__(self):
        return (UuidToken(self._PersistentReadOnlyObject__uuid),)

    def __setstate__(self, state):
        if self.__dict__.pop("_PersistentReadOnlyObject__skip_setstate", None):
            return
        else:
            self.__dict__.update(state)

    def __deepcopy__(self, memo):
        return self

    def __copy__(self):
        return self

# --------------------------------------------------------------
"""
From here on it's just testing stuff; will be moved to another file.
"""


def play_around(queue, thing):
    import copy
    queue.put((thing, copy.deepcopy(thing),))

class Booboo(PersistentReadOnlyObject):
    def __init__(self):
        self.number = random.random()

if __name__ == "__main__":

    import multiprocessing
    import random
    import copy

    def same(a, b):
        return (a is b) and (a == b) and (id(a) == id(b)) and \
               (a.number == b.number)

    a = Booboo()
    b = copy.copy(a)
    c = copy.deepcopy(a)
    assert same(a, b) and same(b, c)

    my_queue = multiprocessing.Queue()
    process = multiprocessing.Process(target = play_around,
                                      args=(my_queue, a,))
    process.start()
    process.join()
    things = my_queue.get()
    for thing in things:
        assert same(thing, a) and same(thing, b) and same(thing, c)
    print("all cool!")
于 2009-09-18T17:10:58.523 回答
1

我不知道已经实现了任何此类功能。有趣的问题如下,并且需要精确的规范来了解在这种情况下会发生什么......:

  • 进程 A 制作 obj 并将其发送给 B ,B 将其解开,到目前为止一切顺利
  • A 更改 X 到 obj,同时 B 更改 Y 到 obj 的 ITS 副本
  • 现在任何一个进程都将它的 obj 发送给另一个进程,这会解开它:此时在每个进程中需要对对象进行哪些更改?A发送给B或反之亦然是否重要,即A是否“拥有”该对象?或者是什么?

如果你不在乎,说因为只有 A OWNS obj——只有 A 被允许进行更改并将 obj 发送给其他人,其他人不能也不会更改——那么问题归结为识别 obj唯一的——一个 GUID 就可以了。该类可以维护将 GUID 映射到现有实例的类属性 dict(可能作为弱值 dict 以避免使实例不必要地保持活动状态,但这是一个附带问题)并确保在适当时返回现有实例。

但是,如果更改需要同步到任何更精细的粒度,那么突然之间,分布式计算就成为一个非常困难的问题,并且在哪些情况下发生的规范需要非常小心地确定(并且比大多数情况下更偏执)我们当中——分布式编程非常棘手,除非狂热地遵循一些简单且可证明正确的模式和习语!-)。

如果您可以为我们确定规格,我可以提供一个草图,说明我将如何尝试满足它们。但我不会假设您代表您猜测规格;-)。

编辑:OP已经澄清,似乎他所需要的只是更好地理解如何控制__new__。这很容易:看__getnewargs__——你需要一个新样式的类并使用协议 2 或更好的进行酸洗(但出于其他原因,这些都是可取的!-),然后__getnewargs__在现有对象中可以简单地返回对象的 GUID(__new__必须接收作为可选参数)。因此__new__可以检查类的memo[[weakvalue;-)]] dict 中是否存在 GUID(如果存在则返回相应的对象值)——如果不存在(或者如果未传递 GUID,则意味着它不是 unpickling,所以必须生成一个新的 GUID),然后制作一个真正的新对象(设置其 GUID;-) 并将其记录在 class-levelmemo中。

顺便说一句,要制作 GUID,请考虑使用标准库中的uuid模块。

于 2009-09-09T15:20:17.477 回答
0

您可以简单地使用一个字典,其中的键和值在接收器中相同。为了避免内存泄漏,请使用 Wea​​kKeyDictionary。

于 2009-09-09T20:25:42.897 回答