8

我正在尝试在 Python 中解析一些数据我有一些 JSON:

{
    "data sources": [
        "http://www.gcmap.com/"
    ],
    "metros": [
        {
            "code": "SCL",
            "continent": "South America",
            "coordinates": {
                "S": 33,
                "W": 71
            },
            "country": "CL",
            "name": "Santiago",
            "population": 6000000,
            "region": 1,
            "timezone": -4
        },
        {
            "code": "LIM",
            "continent": "South America",
            "coordinates": {
                "S": 12,
                "W": 77
            },
            "country": "PE",
            "name": "Lima",
            "population": 9050000,
            "region": 1,
            "timezone": -5
        }
    ]
}

如果我想将"metros"数组解析为 Python 类Metro对象数组,我将如何设置该类?

我刚在想:

class Metro(object):
    def __init__(self):
        self.code = 0
        self.name = ""
        self.country = ""
        self.continent = ""
        self.timezone = ""
        self.coordinates = []
        self.population = 0
        self.region = ""

所以我想遍历每个地铁并将数据放入相应的Metro对象中,然后将该对象放入 Python 对象数组中......如何循环遍历 JSON 地铁?

4

7 回答 7

14

如果您总是获得相同的密钥,您可以使用它**来轻松地构建您的实例。如果您只是使用它来保存值,那么制作Metroa将简化您的生活:namedtuple

from collections import namedtuple
Metro = namedtuple('Metro', 'code, name, country, continent, timezone, coordinates,
                   population, region')

然后简单地

import json
data = json.loads('''...''')
metros = [Metro(**k) for k in data["metros"]]
于 2013-02-21T19:19:32.320 回答
5

这相对容易做到,因为您已经阅读了数据,json.load()在这种情况下,它将为“metros”中的每个元素返回一个 Python 字典——只需遍历它并创建Metro类实例列表。我修改了方法的调用顺序,Metro.__init__()以便更容易从返回的字典中向它传递数据json.load()

由于结果中“metros”列表的每个元素都是一个字典,因此您可以将其传递给 classMetro的构造函数,使用**符号将其转换为关键字参数。然后构造函数可以将这些值传递给它自己update()__dict__

通过以这种方式做事,而不是将 a 之类的东西collections.namedtuple用作数据容器,这Metro是一个自定义类,它使添加您希望的其他方法和/或属性变得微不足道。

import json

class Metro(object):
    def __init__(self, **kwargs):
        self.__dict__.update(kwargs)

    def __str__(self):
        fields = ['    {}={!r}'.format(k,v)
                    for k, v in self.__dict__.items() if not k.startswith('_')]

        return '{}(\n{})'.format(self.__class__.__name__, ',\n'.join(fields))


with open('metros.json') as file:
    json_obj = json.load(file)

metros = [Metro(**metro_dict) for metro_dict in json_obj['metros']]

for metro in metros:
    print('{}\n'.format(metro))

输出:

Metro(
    code='SCL',
    continent='South America',
    coordinates={'S': 33, 'W': 71},
    country='CL',
    name='Santiago',
    population=6000000,
    region=1,
    timezone=-4)

Metro(
    code='LIM',
    continent='South America',
    coordinates={'S': 12, 'W': 77},
    country='PE',
    name='Lima',
    population=9050000,
    region=1,
    timezone=-5)
于 2013-02-21T20:10:04.027 回答
5

假设您正在使用 json 加载数据,我将在这里使用 namedtuple 列表将数据存储在键“metro”下

>>> from collections import namedtuple
>>> metros = []
>>> for e in data[u'metros']:
    metros.append(namedtuple('metro', e.keys())(*e.values()))


>>> metros
[metro(code=u'SCL', name=u'Santiago', country=u'CL', region=1, coordinates={u'S': 33, u'W': 71}, timezone=-4, continent=u'South America', population=6000000), metro(code=u'LIM', name=u'Lima', country=u'PE', region=1, coordinates={u'S': 12, u'W': 77}, timezone=-5, continent=u'South America', population=9050000)]
>>> 
于 2013-02-21T19:21:56.480 回答
2

使用库http://docs.python.org/2/library/json.html中的 json 模块将 json 转换为 Python 字典

于 2013-02-21T19:18:13.377 回答
1

也许像

import json
data = json.loads(<json string>)
data.metros = [Metro(**m) for m in data.metros]

class Metro(object):
    def __init__(self, **kwargs):
        self.code = kwargs.get('code', 0)
        self.name = kwargs.get('name', "")
        self.county = kwargs.get('county', "")
        self.continent = kwargs.get('continent', "")
        self.timezone = kwargs.get('timezone', "")
        self.coordinates = kwargs.get('coordinates', [])
        self.population = kwargs.get('population', 0)
        self.region = kwargs.get('region', 0)
于 2013-02-21T19:24:09.147 回答
0
In [17]: def load_flat(data, inst):
   ....:     for key, value in data.items():
   ....:         if not hasattr(inst, key):
   ....:             raise AttributeError(key)
   ....:         else:
   ....:             setattr(inst, key, value)
   ....:             

In [18]: m = Metro()

In [19]: load_float(data['metros'][0], m)

In [20]: m.__dict__
Out[20]: 
{'code': 'SCL',
 'continent': 'South America',
 'coordinates': {'S': 33, 'W': 71},
 'country': 'CL',
 'name': 'Santiago',
 'population': 6000000,
 'region': 1,
 'timezone': -4}

它不仅非常易读且非常明确,而且还提供了一些基本的字段验证(在不匹配的字段上引发异常等)

于 2013-02-21T19:28:43.993 回答
-1

我会尝试ast。就像是:

metro = Metro()
metro.__dict__ = ast.literal_eval(a_single_metro_dict_string)
于 2013-02-21T19:22:02.860 回答