1

我正在使用这个gist 的单行树轻松地从 excel 中获取信息。这是来自该站点的树的示例:

def tree(): return defaultdict(tree)
taxonomy = tree()
taxonomy['Animalia']['Chordata']['Mammalia']['Carnivora']['Felidae']['Felis']['cat']
taxonomy['Animalia']['Chordata']['Mammalia']['Carnivora']['Felidae']['Panthera']['lion']
taxonomy['Animalia']['Chordata']['Mammalia']['Carnivora']['Canidae']['Canis']['dog']

然后将其转换为 dicts 以进行漂亮的打印:

def dicts(t):
    try:
        return dict((k, dicts(t[k])) for k in t)
    except TypeError:
        return t

澄清

你如何从树上返回钥匙?具体来说,将获取树中的前三层键并将其放入列表中。一个例子是:

('Animalia', 'Chordata', 'Mammalia','Plantae', 'Solanales', 'Convolvulaceae') 

{'Animalia': {'Chordata': {'Mammalia': {'Carnivora': {'Canidae': {'Canis': {'coyote': {},
                                                                        'dog': {}}},
                                                  'Felidae': {'Felis': {'cat': {}},
                                                              'Panthera': {'lion': {}}}},
                                    'Cetacea': {'Balaenopteridae': {'Balaenoptera': {'blue whale': {}}}}}}},
 'Plantae': {'Solanales': {'Convolvulaceae': {'Ipomoea': {'sweet potato': {}}},
                       'Solanaceae': {'Solanum': {'potato': {},
                                                  'tomato': {}}}}}}
4

1 回答 1

2

对于您的问题的新版本(在您的评论中),您想要的是顶级字典的所有键,并且对于每一个,对应的二级字典的所有键,同样如此第三个。

换句话说,您想要一个通过树的所有路径的列表,但在第三级被截断。所以,让我们在树中进行深度优先遍历,并在第三层截断。

首先,让我们编写一个简单的深度优先路径查找器:

def paths(tree, path=()):
    for key, subtree in tree.items():
        if subtree:
            yield from paths(subtree, path + (key,))
        else:
            yield path + (key,)

现在,让我们在深度 3 处截断它:

def prefix_paths(prefix_length, tree, path=()):
    for key, subtree in tree.items():
        if subtree and len(path) + 1 < prefix_length:
            yield from prefix_paths(prefix_length, subtree, path + (key,))
        else:
            yield path + (key,)

就是这样:

>>> results = list(prefix_paths(3, taxonomy))
>>> print(results)
[('Animalia', 'Chordata', 'Mammalia'),
 ('Plantae', 'Solanales', 'Solanaceae'),
 ('Plantae', 'Solanales', 'Convolvulaceae')]

实际上,您在评论中描述的是您想要前三个级别中所有键的单个元组。但是你可以很容易地从上面得到。只需展平列表并消除重复项:

>>> flatten = itertools.chain.from_iterable
>>> keys = flatten(prefix_paths(3, taxonomy))
>>> unique_keys = tuple(set(keys))
>>> print(unique_keys)
('Chordata', 'Convolvulaceae', 'Plantae', 'Solanales', 'Animalia', 'Mammalia', 'Solanaceae')

(顺便说一句,顺序是完全不确定的,因为字典就是这样工作的;我碰巧得到与你评论中相同的顺序只是一个意外,你不应该依赖它……)


同时,这是我对您问题的原始版本的回答(这仍然是问题中所问的……)。

就是这样:

taxonomy['Animalia']['Chordata']['Mammalia']

或者,如果您想要“干净”版本:

dicts(taxonomy)['Animalia']['Chordata']['Mammalia']

或者,或者:

dicts(taxonomy['Animalia']['Chordata']['Mammalia'])

如果您愿意,可以编写一个包装函数。

如果你知道它总是三个关键:

def subtree(tree, three_keys):
    return tree[three_keys[0]][three_keys[1]][three_keys[2]]

如果您希望它使用任意数量的键:

def subtree(tree, keys):
    while keys:
        tree, keys = tree[keys[0]], keys[1:]
    return tree

然后:

subtree(taxonomy, ('Animalia', 'Chordata', 'Mammalia'))

同样,您可以通过其中一个taxonomy或整体结果来dicts获得“干净”版本。

以上所有内容为您提供:

{'Carnivora': {'Canidae': {'Canis': {'dog': {}}},

“猫科动物”:{“猫”:{“猫”:{}},“豹”:{“狮子”:{}}}}}

(或其混乱的defaultdict等价物)。

如果你想让它变得更好:

pprint.pprint(subtree(dicts(taxonomy), ('Animalia', 'Chordata', 'Mammalia')))

…这给你:

{'Carnivora': {'Canidae': {'Canis': {'dog': {}}},
               'Felidae': {'Felis': {'cat': {}},
                           'Panthera': {'lion': {}}}}}}
于 2013-06-26T00:53:13.493 回答