3

我正在使用自定义pickler,根据Shane Hathaway的代码,将任何不可腌制的对象(例如套接字或文件)替换为它们的字符串表示形式: Python: Pickling a dict with some unpicklable items

它在大多数情况下都有效,但是当我尝试取消 Django HttpResponse 时,我收到以下错误:UnpicklingError: NEWOBJ class argument is not a type object

我不知道错误的实际含义。如果可以腌制,为什么不能解开?我在 Google 上找到了三个对这个错误的引用,但没有真正解释它发生的原因或如何修复它。

这是我的代码:

from cPickle import Pickler, Unpickler, UnpicklingError

class FilteredObject:
    def __init__(self, about):
        self.about = about
    def __repr__(self):
        return 'FilteredObject(%s)' % repr(self.about)

class MyPickler(object):
    def __init__(self, file, protocol=2):
        pickler = Pickler(file, protocol)
        pickler.persistent_id = self.persistent_id
        self.dump = pickler.dump
        self.clear_memo = pickler.clear_memo

    def persistent_id(self, obj):
           if not hasattr(obj, '__getstate__') and not isinstance(obj,
        (basestring, bool, int, long, float, complex, tuple, list, set, dict)):
            return ["filtered:%s" % str(obj)]
        else:
            return None

class MyUnpickler(object):
    def __init__(self, file):
        unpickler = Unpickler(file)
        unpickler.persistent_load = self.persistent_load
        self.load = unpickler.load
        self.noload = unpickler.noload

    def persistent_load(self, obj_id):
        if obj_id[0].startswith('filtered:'):
            return FilteredObject(obj_id[0][9:])
        else:
            raise UnpicklingError('Invalid persistent id')

###### serialize to file

f = open('test.txt','wb')
p = MyPickler(f)
p.dump(data)
f.close()

###### unserialize from file

f = open('test.txt','rb')
pickled_data = f.read()
f.seek(0)
u = MyUnpickler(f)
data = u.load()    
4

1 回答 1

1

成功的酸洗分两步进行,Pickler 的 pickle.dump 和 Unpickler 的 pickle.load。Pickler 将对象转换为序列化格式(例如字符串),而 Unpickler 消化腌制的对象并生成应该与原始对象等效的新对象。Pickle 有几个函数可以用来转储pickle……所以第 1 部分是让对象转换为序列化格式。使用自定义pickler,您可以绕过python的一些保护措施来腌制pickle本身无法腌制的对象。按照您的示例,我可以创建一个简单的 Pickler,通过将每个对象转换为它的__repr__.

>>> x = lambda x:x
>>> repr(x)
'<function <lambda> at 0x4d39cf0>'
>>> 
>>> import pickle
>>> l = repr(x)
>>> pickle.dumps(l)
"S'<function <lambda> at 0x4d39cf0>'\np0\n."

这肯定是可腌制的,因为它是一个字符串。但是,问题是如何从保存的字符串构建对象。对于 lambda,如果您有一个可以查找字符串中记录的内存引用的函数,则可以取回该对象……但前提是您的内存中仍然存在原始对象……所以那不是好的。因此,只有当字符串中包含足够的信息__repr__来从存储的字符串信息中构建一个新对象时,转换为字符串的技巧才有效。您可以对所存储的内容更加感兴趣,但最终很可能会通过将对象转换为字符串而遇到问题。所以这是你的 Pickler 可以工作,但你的 Unpickler 会失败的情况。

字典很有趣,因为它们可以包含任何内容,而且通常很快。最讨厌的字典之一是globals()字典。要序列化它,我会使用dill,它可以序列化 python 中的几乎任何东西。

>>> import dill
>>> 
>>> def foo(a):
...   def bar(x):
...     return a*x
...   return bar
... 
>>> class baz(object):
...   def __call__(self, a,x):
...     return foo(a)(x)
... 
>>> b = baz()
>>> b(3,2)
6
>>> c = baz.__call__
>>> c(b,3,2)
6
>>> g = dill.loads(dill.dumps(globals()))
>>> g
{'dill': <module 'dill' from '/Library/Frameworks/Python.framework/Versions/7.2/lib/python2.7/site-packages/dill-0.2a.dev-py2.7.egg/dill/__init__.pyc'>, 'c': <unbound method baz.__call__>, 'b': <__main__.baz object at 0x4d61970>, 'g': {...}, '__builtins__': <module '__builtin__' (built-in)>, 'baz': <class '__main__.baz'>, '_version': '2', '__package__': None, '__name__': '__main__', 'foo': <function foo at 0x4d39d30>, '__doc__': None}

实际上,dill 将它的类型注册到pickle注册表中,所以如果您有一些使用的黑盒代码pickle并且您不能真正编辑它,那么只需导入 dill 就可以神奇地使其工作而无需猴子修补第 3 方代码。

或者,如果您希望将整个解释器会话作为“python 图像”发送,dill 也可以这样做。

>>> # continuing from above
>>> dill.dump_session('foobar.pkl')
>>>
>>> ^D
dude@sakurai>$ python
Python 2.7.5 (default, Sep 30 2013, 20:15:49) 
[GCC 4.2.1 (Apple Inc. build 5566)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import dill
>>> dill.load_session('foobar.pkl')
>>> c(b,3,2)
6

Dill 还提供了一些很好的工具,可以帮助您了解在代码失败时导致酸洗失败的原因。

于 2013-10-19T15:07:16.643 回答