有很多关于解析 twitter json 的帖子,但我没有看到解决我的问题。
这是代码
import json
file = open('tweet', 'r')
tweet = file.read()
#{"geo":null,"text":"Lmao!! what time? I dont finish evening cleaning till 5 RT \u201c@some_user: football anyone?.....i wanna have a kickabout :(\u201d"}
#{"geo":null,"text":"Lmao!! what time? I dont finish evening cleaning till 5 RT @some_user: football anyone?.....i wanna have a kickabout :("}
def parseStreamingTweet(tweet):
try:
singleTweetJson = json.loads(tweet)
for index in singleTweetJson:
if index == 'text':
print "text : ", singleTweetJson[index]
except ValueError:
print "Error ", tweet
print ValueError
return
parseStreamingTweet(tweet)
这是测试程序。推文进入流媒体,出于检查目的,我已将推文保存在文件中并进行了检查。推特提要有一个经过编辑的部分。
谁能告诉我如何解析单编码的推文。评论中的第一条推文是单码的,第二条不是。首先有错误,在删除uni-code字符串时,解析成功。有什么解决办法?