12

我有嵌套字典:

{'key0': {'attrs': {'entity': 'p', 'hash': '34nj3h43b4n3', 'id': '4130'},
          u'key1': {'attrs': {'entity': 'r',
                              'hash': '34njasd3h43b4n3',
                              'id': '4130-1'},
                    u'key2': {'attrs': {'entity': 'c',
                                        'hash': '34njasd3h43bdsfsd4n3',
                                        'id': '4130-1-1'}}},
          u'key3': {'attrs': {'entity': 'r',
                              'hash': '34njasasasd3h43b4n3',
                              'id': '4130-2'},
                    u'key4': {'attrs': {'entity': 'c',
                                        'hash': '34njawersd3h43bdsfsd4n3',
                                        'id': '4130-2-1'}},
                    u'key5': {'attrs': {'entity': 'c',
                                        'hash': '34njawersd3h43bdsfsd4n3',
                                        'id': '4130-2-2'}}}},
 'someohterthing': 'someothervalue',
 'something': 'somevalue'}
                                                            
      

给定一个id - 之一。 导航到正确字典的最简单方法是什么?ids41304130-2-2

如果给定id的是,4130-2-1那么它应该到达字典key=key5

请不要使用 XML 方法。

编辑(1):嵌套在1级别之间4,但我在解析之前知道嵌套。

编辑(2):修复了代码。

编辑(3):再次修复了字符串值的代码ids。请原谅造成的混乱。我希望这是最终的:)

4

7 回答 7

15

你的结构非常不规则。这是一个带有遍历子字典的访问者函数的版本。attrs

def walkDict( aDict, visitor, path=() ):
    for  k in aDict:
        if k == 'attrs':
            visitor( path, aDict[k] )
        elif type(aDict[k]) != dict:
            pass
        else:
            walkDict( aDict[k], visitor, path+(k,) )

def printMe( path, element ):
    print path, element

def filterFor( path, element ):
    if element['id'] == '4130-2-2':
        print path, element

你会像这样使用它。

walkDict( myDict, filterFor )

这可以变成生成器而不是访问者;它不会yield path, aDict[k]调用访问者函数。

你会在 for 循环中使用它。

for path, attrDict in walkDictIter( aDict ):
    # process attrDict...
于 2008-12-19T12:45:28.827 回答
14

如果您想以一般方式解决问题,无论您的 dict 中有多少级嵌套,都可以创建一个遍历树的递归函数:

def traverse_tree(dictionary, id=None):
    for key, value in dictionary.items():
        if key == 'id':
            if value == id:
                print dictionary
        else:
             traverse_tree(value, id)
    return

>>> traverse_tree({1: {'id': 2}, 2: {'id': 3}}, id=2)
{'id': 2}
于 2008-12-19T11:44:56.887 回答
9

这类问题通常通过适当的类定义而不是通用字典更好地解决。

class ProperObject( object ):
    """A proper class definition for each "attr" dictionary."""
    def __init__( self, path, attrDict ):
        self.path= path
        self.__dict__.update( attrDict )
    def __str__( self ):
        return "path %r, entity %r, hash %r, id %r" % (
            self.path, self.entity, self.hash, self.id )

masterDict= {} 
def builder( path, element ):
    masterDict[path]= ProperObject( path, element )

# Use the Visitor to build ProperObjects for each "attr"
walkDict( myDict, builder )

# Now that we have a simple dictionary of Proper Objects, things are simple
for k,v in masterDict.items():
    if v.id == '4130-2-2':
        print v

此外,既然您有正确的对象定义,您可以执行以下操作

# Create an "index" of your ProperObjects
import collections
byId= collections.defaultdict(list)
for k in masterDict:
    byId[masterDict[k].id].append( masterDict[k] )

# Look up a particular item in the index
print map( str, byId['4130-2-2'] )
于 2008-12-19T13:37:03.527 回答
5

这是一个老问题,但仍然是谷歌的顶级结果,所以我会更新:

我和一个朋友发布了一个库来解决(非常接近)这个确切的问题。dpath-python(与执行类似操作的 perl dpath 模块无关)。

http://github.com/akesterson/dpath-python

您需要做的就是这样的:

$ easy_install dpath
>>> import dpath.util
>>> results = []
>>> for (path, value) in dpath.util.search(my_dictionary, "*/attrs/entity/4130*", yielded=True):
>>> ... parent = dpath.util.search("/".join(path.split("/")[:-2])
>>> ... results.append(parent)

...这将为您提供与您的搜索匹配的所有字典对象的列表,即所有具有 (key = 4130*) 的对象。父位有点笨拙,但它会起作用。

于 2013-05-12T13:46:28.663 回答
1

由于已知递归在 python 中是有限的(请参阅 Python 中的最大递归深度是多少,以及如何增加它?)我宁愿对这个问题有一个基于循环的答案,所以答案可以适应任何深度级别在字典里。为此,函数

def walkDict( aDict, visitor, path=() ):
    for  k in aDict:
        if k == 'attrs':
            visitor( path, aDict[k] )
        elif type(aDict[k]) != dict:
            pass
        else:
            walkDict( aDict[k], visitor, path+(k,) )

可以替换为:

def walkDictLoop(aDict, visitor, path=()):
    toProcess = [(aDict, path)]
    while toProcess:
        dictNode, pathNode = toProcess.pop(0)
        for k in dictNode:
            if k == 'attrs':
                visitor(pathNode, dictNode[k])
            if isinstance(dictNode[k], dict):
                toProcess.append( (dictNode[k], pathNode+(k,)) )
于 2014-05-09T15:41:51.130 回答
0

好吧,如果你只需要做几次,你可以使用嵌套的 dict.iteritems() 来找到你要找的东西。

如果你打算做几次,性能很快就会成为一个问题。在这种情况下,您可以:

  • 将您的数据返回给您的方式更改为更合适的方式。

  • 如果不能,将数据转换为 id 和键之间的字典(使用 iteritems)。然后使用它。

于 2008-12-19T11:43:22.210 回答
0

我相信 pydash 会给你最有效的方法来实现这一点。

例如:

data = {'a': {'b': {'c': [0, 0, {'d': [0, {1: 2}]}]}}, 'names': {'first': 'gus', 'second': 'parvez'}}

pydash.get(data, 'a.b.c.2.d.1.[1]')

# output: 2

您可以在此处找到详细文档: https ://pydash.readthedocs.io/en/latest/quickstart.html

于 2019-01-16T11:30:55.030 回答