5

使用 python 和 twitter api 获取推文对象。

我有一个包含推文的文件(tweetfile = 我计算机上的 .txt 文件),我正在尝试遍历对象以获取文本。我用 tweetObj.keys() 检查了 twitter 对象以查看键和“文本”;但是,当我尝试使用 tweetObj['text'] 获取单个文本时,我得到 KeyError: 'text'

代码:

for line in tweetfile:
    tweetObj = json.loads(line)
    keys =  tweetObj.keys()
    print keys
    tweet = tweetObj['text']
    print tweet

下面是输出:

[u'contributors', u'truncated', u'text', u'in_reply_to_status_id', u'id', u'favorite_count', u'source', u'retweeted', u'coordinates', u'entities', u'in_reply_to_screen_name', u'id_str', u'retweet_count', u'in_reply_to_user_id', u'favorited', u'user', u'geo', u'in_reply_to_user_id_str', u'possibly_sensitive', u'lang', u'created_at', u'filter_level', u'in_reply_to_status_id_str', u'place']
@awe5sauce my dad was like "so u wanna be in a relationship with a 'big dumb idiot'" nd i was like yah shes the bae u feel lmao
[u'delete']
Traceback (most recent call last):
  File "C:\apps\droid\a1\tweets.py", line 34, in <module>
main()
  File "C:\apps\droid\a1\tweets.py", line 28, in main
    tweet = tweetObj['text']
KeyError: 'text'

我不确定如何处理,因为它看起来像是打印了一条推文。问题是为什么在密钥存在并且似乎返回一个值但并非针对所有实例的情况下会发生这种情况,我如何将其更正到可以使用该密钥访问所有行的值的位置?

4

1 回答 1

7

在循环中创建了 2 个字典,每行一个。第一个有text,第二个只有一个'delete'键。它没有'text'钥匙。因此出现错误消息。

将其更改为:

for line in tweetfile:
    tweetObj = json.loads(line)
    keys =  tweetObj.keys()
    print keys
    if 'text' in tweetObj:
        print tweetObj['text']
    else:
        print 'This does not have a text entry'      

只是让您知道,如果您只对包含 的行感兴趣text,您可能想要使用

[ json.loads(l)['text'] for l in tweetfile if 'text' in json.loads(l) ]

或者

'\n'.join([ json.loads(l)['text'] for l in tweetfile if 'text' in json.loads(l) ])

甚至更好

[ json.loads(l).get('text') for l in tweetfile]

于 2014-07-18T02:08:38.573 回答