4

这是我从其他地方得到的结构,即深度嵌套字典的列表:

{
    "foo_code": 404,
    "foo_rbody": {
        "query": {
            "info": {
                "acme_no": "444444",
                "road_runner": "123"
            },
            "error": "no_lunch",
            "message": "runner problem."
        }
    },
    "acme_no": "444444",
    "road_runner": "123",
    "xyzzy_code": 200,
    "xyzzy_rbody": {
        "api": {
            "items": [
                {
                    "desc": "OK",
                    "id": 198,
                    "acme_no": "789",
                    "road_runner": "123",
                    "params": {
                        "bicycle": "2wheel",
                        "willie": "hungry",
                        "height": "1",
                        "coyote_id": "1511111"
                    },
                    "activity": "TRAP",
                    "state": "active",
                    "status": 200,
                    "type": "chase"
                }
            ]
        }
    }
}

{
    "foo_code": 200,
    "foo_rbody": {
        "query": {
            "result": {
                "acme_no": "260060730303258",
                "road_runner": "123",
                "abyss": "26843545600"
            }
        }
    },
    "acme_no": "260060730303258",
    "road_runner": "123",
    "xyzzy_code": 200,
    "xyzzy_rbody": {
        "api": {
            "items": [
                {
                    "desc": "OK",
                    "id": 198,
                    "acme_no": "789",
                    "road_runner": "123",
                    "params": {
                        "bicycle": "2wheel",
                        "willie": "hungry",
                        "height": "1",
                        "coyote_id": "1511111"
                    },
                    "activity": "TRAP",
                    "state": "active",
                    "status": 200,
                    "type": "chase"
                }
            ]
        }
    }
}

要求不同的结构是不可能的(旧版 api 等)。

所以我想知道是否有一些聪明的方法可以从这样的结构中提取选定的值。

我想到的候选人:

  • 展平特定的字典,构建复合键,例如:

    {“foo_rbody.query.info.acme_no”:“444444”,“foo_rbody.query.info.road_runner”:“123”,...}

优点:通过一次访问获取每个值,如果不存在可预测的键,则表示结构不存在(您可能已经注意到,字典可能具有不同的结构,具体取决于它是否成功操作、发生错误等)。

缺点:如何处理列表?

  • 使用一些递归函数来进行连续的键查找,比如“foo_rbody”,然后是“query”、“info”等。

有更好的候选人吗?

4

4 回答 4

9

您可以尝试这个相当简单的函数来访问嵌套属性:

import re

def get_path(dct, path):
    for i, p in re.findall(r'(\d+)|(\w+)', path):
        dct = dct[p or int(i)]
    return dct

用法:

value = get_path(data, "xyzzy_rbody.api.items[0].params.bicycle")
于 2013-08-06T21:09:48.017 回答
2

也许我对这篇文章byPath的回答中的功能可能会对您有所帮助。

于 2013-08-06T20:16:53.863 回答
1

You could create your own path mechanism and then query the complicated dict with paths. Example:

  • / : get the root object
  • /key: get the value of root_object['key'], e.g. /foo_code --> 404
  • /key/key: nesting: /foo_rbody/query/info/acme_no -> 444444
  • /key[i]: get ith element of that list, e.g. /xyzzy_rbody/api/items[0]/desc --> "OK"

The path can also return a dict which you then run more queries on, etc.

It would be fairly easy to implement recursively.

于 2013-08-06T19:58:38.053 回答
1

我考虑了另外两个解决方案:

您可以尝试包Pynq,在此处描述 - JSON 的结构化查询语言(在 Python 中)。据我了解,它是某种用于 python 的 LINQ。

您也可以尝试将您的 JSON 转换为 XML,然后使用 Xquery 语言从中获取数据 - Python 下的 XQuery 库

于 2013-08-06T20:23:55.767 回答