1

我正在尝试将一些 API JSON 数据导出到 csv,但我只想要其中的一些。我试过row.append了,但我得到了错误TypeError: string indices must be integers

我是 python 新手,对于它为什么需要一个整数有点困惑。

import urllib2
import json
import csv

outfile_path='/NYTComments.csv'

writer = csv.writer(open(outfile_path, 'w'))

url = urllib2.Request('http://api.nytimes.com/svc/community/v2/comments/recent?api-key=ea7aac6c5d0723d7f1e06c8035d27305:5:66594855')

parsed_json = json.load(urllib2.urlopen(url))

print parsed_json

for comment in parsed_json['results']:
    row = []
    row.append(str(comment['commentSequence'].encode('utf-8')))
    row.append(str(comment['commentBody'].encode('utf-8')))
    row.append(str(comment['commentTitle'].encode('utf-8')))
    row.append(str(comment['approveDate'].encode('utf-8')))
    writer.writerow(row)

打印出来的 parsed_json 看起来像这样:

{u'status': u'OK',
u'results':
    {u'totalCommentsReturned': 25,
    u'comments':
        [{
            u'status': u'approved',
            u'sharing': 0,
            u'approveDate': u'1349378866',
            u'display_name': u'Seymour B Moore',
            u'userTitle': None,
            u'userURL': None,
            u'replies': [],
            u'parentID': None,
            u'articleURL': u'http://fifthdown.blogs.nytimes.com/2012/10/03/thursday-matchup-cardinals-vs-rams/',
            u'location': u'SoCal',
            u'userComments': u'api.nytimes.com/svc/community/v2/comments/user/id/26434659.xml',
            u'commentSequence': 2,
            u'editorsSelection': 0,
            u'times_people': 1,
            u'email_status': u'0',
            u'commentBody': u"I know most people won't think this is a must watch game, but it will go a long way .... (truncated)",
            u'recommendationCount': 0,
            u'commentTitle': u'n/a'
        }]
    }
}
4

2 回答 2

2

看起来你犯了一个我一直犯的错误。代替

for comment in parsed_json['results']:

你要

for comment_name, comment in parsed_json['results'].iteritems():

(或者.items()如果您使用的是 Python 3)。

只需遍历字典(parsed_json['results']大概是这样)就可以为您提供字典的,而不是元素。如果你这样做

for thing in {'a': 1, 'b': 2}:

然后thing将循环“a”和“b”。

然后,因为该键显然是一个字符串,所以您正在尝试执行类似 的操作"some_name"['commentSequence'],这会导致您看到的错误消息。

dict.iteritems(), 另一方面,给你一个迭代器,它会给你像('a', 1)then这样的元素('b', 2);然后循环中的两个变量for被分配给那里的两个元素,所以comment_name == 'a'comment == 1这里。

由于您似乎实际上并没有使用 from 的密钥parsed_json['results'],因此您也可以循环for comment in parsed_json['results'].itervalues()

于 2012-10-04T22:06:58.367 回答
0
for comment in parsed_json['results']: #'comment' contains keys, not values

应该

for comment in parsed_json['results']['comments']:

parsed_json['results']本身就是另一本字典。

parsed_json['results']['comments']是您要迭代的字典列表。

于 2012-10-04T22:13:28.630 回答