0

我正在尝试使用 Twittter API 和 Python 获取推文的文本

我使用 oauth 登录并获取结果字典:

jsonTweets = json.loads(response)
list = jsonTweets["statuses"]   # list of dictionaries

type(jsonTweets)  #returns dict
type(list)    #returns list
type(list[0])    #return dict (it's a list of dictionaries)

list[0] 是一个字典:

{u'contributors': None, u'truncated': False, u'text': u'RT @Kagame_quotes: "We, the people of #Rwanda, our country has its own problems that we can\u2019t attribute to others, we need to find solution\u2026', u'in_reply_to_status_id': None, u'id': 387905246028394496L, u'favorite_count': 0, u'source': u'<a href="http://twitter.com" rel="nofollow">Twitter Web Client</a>', u'retweeted': False, u'coordinates': None,ETC...

我只想获取u'text'键的值(即获取推文)

所以我写:

for item in list:
    print item[u'text']

但这给了我错误:

UnicodeEncodeError: 'ascii' codec can't encode character u'\u2019'
in position 91: ordinal not in range(128)

如何获取u'text'密钥的值?

4

2 回答 2

1

您需要指定 UTF-8 编码:

for item in list:
    print item[u'text'].encode('utf-8')

这应该够了吧。

于 2013-10-09T11:56:23.240 回答
0

你的文字没有问题。它只包含 unicode 字符,您无法在控制台上打印。

特别是(查看此http://www.utf8-chartable.de/unicode-utf8-table.pl):

  • U+2019 右单引号
  • U+2026 水平省略号
于 2013-10-09T13:12:16.577 回答