正如我在对您的问题的评论中所说,在查看了json
模块的源代码之后,它似乎不适合做您想做的事情。然而,这个目标可以通过所谓的猴子补丁来实现
(参见问题什么是猴子补丁?)。这可以在您的包的__init__.py
初始化脚本中完成,并且会影响所有后续json
模块序列化,因为模块通常只加载一次并且结果缓存在sys.modules
.
该补丁更改了默认 json 编码器的default
方法——默认的default()
.
为简单起见,这是一个作为独立模块实现的示例:
模块:make_json_serializable.py
""" Module that monkey-patches json module when it's imported so
JSONEncoder.default() automatically checks for a special "to_json()"
method and uses it to encode the object if found.
"""
from json import JSONEncoder
def _default(self, obj):
return getattr(obj.__class__, "to_json", _default.default)(obj)
_default.default = JSONEncoder.default # Save unmodified default.
JSONEncoder.default = _default # Replace it.
使用它很简单,因为只需导入模块即可应用补丁。
示例客户端脚本:
import json
import make_json_serializable # apply monkey-patch
class Foo(object):
def __init__(self, name):
self.name = name
def to_json(self): # New special method.
""" Convert to JSON format string representation. """
return '{"name": "%s"}' % self.name
foo = Foo('sazpaz')
print(json.dumps(foo)) # -> "{\"name\": \"sazpaz\"}"
要保留对象类型信息,特殊方法还可以将其包含在返回的字符串中:
return ('{"type": "%s", "name": "%s"}' %
(self.__class__.__name__, self.name))
这会产生以下 JSON,现在包含类名:
"{\"type\": \"Foo\", \"name\": \"sazpaz\"}"
魔术师在这里
甚至比default()
寻找一个特殊命名的方法更好的是,它能够自动序列化大多数 Python 对象,包括用户定义的类实例,而无需添加特殊方法。在研究了许多替代方案之后,以下 - 基于@Raymond Hettinger 对另一个问题的回答- 使用该pickle
模块,对我来说似乎最接近理想:
模块:make_json_serializable2.py
""" Module that imports the json module and monkey-patches it so
JSONEncoder.default() automatically pickles any Python objects
encountered that aren't standard JSON data types.
"""
from json import JSONEncoder
import pickle
def _default(self, obj):
return {'_python_object': pickle.dumps(obj)}
JSONEncoder.default = _default # Replace with the above.
当然,所有东西都不能腌制——例如扩展类型。但是,通过 pickle 协议定义了通过编写特殊方法来处理它们的方法——类似于你建议的方法和我之前描述的方法——但是对于少数情况来说,这样做可能是必要的。
反序列化
无论如何,使用 pickle 协议还意味着通过在使用传入字典中的任何键的任何调用object_hook
上提供自定义函数参数(只要它有一个),就可以相当容易地重建原始 Python 对象。就像是:json.loads()
'_python_object'
def as_python_object(dct):
try:
return pickle.loads(str(dct['_python_object']))
except KeyError:
return dct
pyobj = json.loads(json_str, object_hook=as_python_object)
如果这必须在许多地方完成,那么定义一个自动提供额外关键字参数的包装函数可能是值得的:
json_pkloads = functools.partial(json.loads, object_hook=as_python_object)
pyobj = json_pkloads(json_str)
自然地,这也可以被猴子修补到json
模块中,使函数成为默认值object_hook
(而不是None
)。
我从Raymond Hettingerpickle
对另一个 JSON 序列化问题的回答中得到了使用的想法,我认为这个问题非常可信并且是官方来源(如 Python 核心开发人员)。
移植到 Python 3
上面的代码在 Python 3 中不起作用,因为json.dumps()
返回了一个无法处理的bytes
对象。JSONEncoder
但是,该方法仍然有效。解决此问题的一种简单方法是latin1
“解码”返回的值pickle.dumps()
,然后latin1
在将其传递给函数之前对其pickle.loads()
进行as_python_object()
“编码”。这是有效的,因为任意二进制字符串都是有效latin1
的,它总是可以解码为 Unicode,然后再次编码回原始字符串(正如 Sven Marnach 在这个答案中指出的那样)。
(虽然以下在 Python 2 中运行良好,latin1
但它所做的解码和编码是多余的。)
from decimal import Decimal
class PythonObjectEncoder(json.JSONEncoder):
def default(self, obj):
return {'_python_object': pickle.dumps(obj).decode('latin1')}
def as_python_object(dct):
try:
return pickle.loads(dct['_python_object'].encode('latin1'))
except KeyError:
return dct
class Foo(object): # Some user-defined class.
def __init__(self, name):
self.name = name
def __eq__(self, other):
if type(other) is type(self): # Instances of same class?
return self.name == other.name
return NotImplemented
__hash__ = None
data = [1,2,3, set(['knights', 'who', 'say', 'ni']), {'key':'value'},
Foo('Bar'), Decimal('3.141592653589793238462643383279502884197169')]
j = json.dumps(data, cls=PythonObjectEncoder, indent=4)
data2 = json.loads(j, object_hook=as_python_object)
assert data == data2 # both should be same