1

我正在尝试将 JSON 文件有选择地转换为 CSV。这意味着我想遍历 JSON。

编写我的 CSV 的代码如下所示:

f = csv.writer(open("test.csv", "wb+"))
f.writerow(["id", "text", "polarity"])
for x in final:
    f.writerow([x["id"], 
                x["text"], 
                x["polarity"]])

可悲的是,我收到以下错误:

TypeError: string indices must be integers

我已经知道问题出在哪里了。加载后我检查了我的 JSON 的类型。这是一个字典,所以应该没问题。

当我打印我的字典时:

print (final)

我得到:

{u'data': [{u'polarity': 2, u'text': u'How deep is your love - Micheal Buble Ft Kelly Rowland ?', u'meta': {u'language': u'en'}, u'id': u'1'}, {u'polarity': 2, u'text': u'RT @TrueTeenQuotes: #SongsThatNeverGetOld Nelly ft. Kelly Rowland - Dilemma', u'meta': {u'language': u'en'}, u'id': u'2'}, {u'polarity': 2, u'text': u'RT @GOforCARL: Dilemma - Nelly Feat. Kelly Rowland #Ohh #SongsThatNeverGetOld', u'meta': {u'language': u'en'}, u'id': u'3'}, {u'polarity': 2, u'text': u'#NP Kelly Rowland Grown Woman', u'meta': {u'language': u'en'}, u'id': u'4'}, {u'polarity': 2, u'text': u"My friend just said 'kelly rowland is gettin it good... Most of her songs are sexual'", u'meta': {u'language': u'en'}, u'id': u'5'}, {u'polarity': 2, u'text': u'No. Kelly Rowland is the Black Barbie, idc', u'meta': {u'language': u'en'}, u'id': u'6'}, {u'polarity': 2, u'text': u'Nelly - Gone ft. Kelly Rowland http://t.co/tXjhCS05l0', u'meta': {u'language': u'en'}, u'id': u'7'}, {u'polarity': 2, u'text': u'Kisses Down Low by Kelly Rowland killer?\u2018?\u2018?\u2018 #NellyVille', u'meta': {u'language': u'en'}, u'id': u'8'}]}

除了“极性”的值之外,每个项目似乎都在 Unicode 中。我现在有 3 个问题。1.所有项目都应该是unicode吗?如何更改字典中的格式?这能解决我的问题吗?

4

1 回答 1

1

在 Python 中迭代字典会为您提供 dict 的键作为字符串 - 因此x在上面的示例中将只包含字符串"data"

如果要遍历与字典u"data"键关联的列表值中的 final字典,则必须用 Python 编写:

...
for x in final[u"data"]:
    f.writerow([x["id"], 
                x["text"], 
                x["polarity"]])
于 2013-07-10T19:07:56.433 回答