我想创建一个 python 字典,返回字典中缺少键的键值。
使用示例:
dic = smart_dict()
dic['a'] = 'one a'
print(dic['a'])
# >>> one a
print(dic['b'])
# >>> b
我想创建一个 python 字典,返回字典中缺少键的键值。
使用示例:
dic = smart_dict()
dic['a'] = 'one a'
print(dic['a'])
# >>> one a
print(dic['b'])
# >>> b
dict
s__missing__
对此有一个钩子:
class smart_dict(dict):
def __missing__(self, key):
return key
可以将其简化为(因为self
从未使用过):
class smart_dict(dict):
@staticmethod
def __missing__(key):
return key
你为什么不直接使用
dic.get('b', 'b')
当然,您可以dict
像其他人指出的那样进行子类化,但我发现每隔一段时间提醒自己get
可以有一个默认值很方便!
如果你想defaultdict
尝试一下,试试这个:
dic = defaultdict()
dic.__missing__ = lambda key: key
dic['b'] # should set dic['b'] to 'b' and return 'b'
除了...好:AttributeError: ^collections.defaultdict^object attribute '__missing__' is read-only
,所以你将不得不子类:
from collections import defaultdict
class KeyDict(defaultdict):
def __missing__(self, key):
return key
d = KeyDict()
print d['b'] #prints 'b'
print d.keys() #prints []
恭喜。你也发现了标准collections.defaultdict
类型的无用。如果那一堆可恶的代码气味
像我一样冒犯了您的敏感感受,那么这就是您幸运的 StackOverflow 日。
由于内置的 3 参数变体的禁忌奇迹type()
,制作一个无用的默认字典类型既有趣又有利可图。
绝对没有,假设你喜欢多余的样板和令人震惊的愚蠢collections.defaultdict
——它应该像预期的那样表现,但实际上并没有。公平地说,对于只需要一个默认字典的小规模用例来说, Jochen Ritzel公认的子类化dict
和实现可选__missing__()
方法 的解决方案是一个极好的解决方法。
但是这种样板的扩展性很差。如果您发现自己实例化了多个默认字典,每个字典都有自己稍微不同的逻辑来生成缺失的键值对,那么需要一个工业强度的替代自动化样板。
或者至少不错。因为为什么不修复损坏的东西?
在不到 10 行的纯 Python(不包括文档字符串、注释和空格)中,我们现在定义了一个DefaultDict
类型,该类型使用用户定义的可调用对象进行初始化,为缺失的键生成默认值。传递给标准collections.defaultdict
类型的可调用对象毫无用处地不接受任何
参数,而传递给我们的DefaultDict
类型的可调用对象则有用地接受以下两个参数:
鉴于这种类型,解决sorin的问题可以简化为一行 Python:
>>> dic = DefaultDict(lambda self, missing_key: missing_key)
>>> dic['a'] = 'one a'
>>> print(dic['a'])
one a
>>> print(dic['b'])
b
理智。终于。
def DefaultDict(keygen):
'''
Sane **default dictionary** (i.e., dictionary implicitly mapping a missing
key to the value returned by a caller-defined callable passed both this
dictionary and that key).
The standard :class:`collections.defaultdict` class is sadly insane,
requiring the caller-defined callable accept *no* arguments. This
non-standard alternative requires this callable accept two arguments:
#. The current instance of this dictionary.
#. The current missing key to generate a default value for.
Parameters
----------
keygen : CallableTypes
Callable (e.g., function, lambda, method) called to generate the default
value for a "missing" (i.e., undefined) key on the first attempt to
access that key, passed first this dictionary and then this key and
returning this value. This callable should have a signature resembling:
``def keygen(self: DefaultDict, missing_key: object) -> object``.
Equivalently, this callable should have the exact same signature as that
of the optional :meth:`dict.__missing__` method.
Returns
----------
MappingType
Empty default dictionary creating missing keys via this callable.
'''
# Global variable modified below.
global _DEFAULT_DICT_ID
# Unique classname suffixed by this identifier.
default_dict_class_name = 'DefaultDict' + str(_DEFAULT_DICT_ID)
# Increment this identifier to preserve uniqueness.
_DEFAULT_DICT_ID += 1
# Dynamically generated default dictionary class specific to this callable.
default_dict_class = type(
default_dict_class_name, (dict,), {'__missing__': keygen,})
# Instantiate and return the first and only instance of this class.
return default_dict_class()
_DEFAULT_DICT_ID = 0
'''
Unique arbitrary identifier with which to uniquify the classname of the next
:func:`DefaultDict`-derived type.
'''
钥匙……明白了,钥匙?对这个神秘魔法的调用是
对内置函数的3 参数变体type()
的调用:
type(default_dict_class_name, (dict,), {'__missing__': keygen,})
这一行动态生成一个新的dict
子类,将可选方法别名为__missing__
调用者定义的可调用对象。请注意明显缺乏样板,将DefaultDict
使用减少到一行 Python。
自动化取得惊人的胜利。
第一位受访者提到defaultdict
,但您可以__missing__
为 的任何子类定义dict
:
>>> class Dict(dict):
def __missing__(self, key):
return key
>>> d = Dict(a=1, b=2)
>>> d['a']
1
>>> d['z']
'z'
另外,我喜欢第二位受访者的方法:
>>> d = dict(a=1, b=2)
>>> d.get('z', 'z')
'z'
我同意这应该很容易做到,也很容易设置不同的默认值或以某种方式转换缺失值的函数。
受Cecil Curry回答的启发,我问自己:为什么不将默认生成器(常量或可调用)作为类的成员,而不是一直生成不同的类?让我演示一下:
# default behaviour: return missing keys unchanged
dic = FlexDict()
dic['a'] = 'one a'
print(dic['a'])
# 'one a'
print(dic['b'])
# 'b'
# regardless of default: easy initialisation with existing dictionary
existing_dic = {'a' : 'one a'}
dic = FlexDict(existing_dic)
print(dic['a'])
# 'one a'
print(dic['b'])
# 'b'
# using constant as default for missing values
dic = FlexDict(existing_dic, default = 10)
print(dic['a'])
# 'one a'
print(dic['b'])
# 10
# use callable as default for missing values
dic = FlexDict(existing_dic, default = lambda missing_key: missing_key * 2)
print(dic['a'])
# 'one a'
print(dic['b'])
# 'bb'
print(dic[2])
# 4
它是如何工作的?没那么难:
class FlexDict(dict):
'''Subclass of dictionary which returns a default for missing keys.
This default can either be a constant, or a callable accepting the missing key.
If "default" is not given (or None), each missing key will be returned unchanged.'''
def __init__(self, content = None, default = None):
if content is None:
super().__init__()
else:
super().__init__(content)
if default is None:
default = lambda missing_key: missing_key
self.default = default # sets self._default
@property
def default(self):
return self._default
@default.setter
def default(self, val):
if callable(val):
self._default = val
else: # constant value
self._default = lambda missing_key: val
def __missing__(self, x):
return self.default(x)
当然,人们可以争论是否要允许在初始化后更改默认函数,但这只是意味着将@default.setter
其逻辑删除并吸收到__init__
.
启用对当前(常量)默认值的自省可以添加两行额外的行。
子类dict
的__getitem__
方法。例如,如何正确继承 dict 并覆盖 __getitem__ 和 __setitem__