10

我正在尝试遵循“挖掘社交网络”一书的示例代码,1-3。

我知道它很旧,所以我按照网页中的新示例在此处输入链接描述

但是,有时,我在实现代码时会遇到错误信息:

[ trend.decode('utf-8') for trend in world_trends()[0]['trends'] ]

错误信息是这样的:

Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "build/bdist.macosx-10.6-universal/egg/twitter/api.py", line 167, in __call__
File "build/bdist.macosx-10.6-universal/egg/twitter/api.py", line 173, in _handle_response
File "/System/Library/Frameworks/Python.framework/Versions/2.6/lib/python2.6/encodings/utf_8.py", line 16, in decode
return codecs.utf_8_decode(input, errors, True)
UnicodeDecodeError: 'utf8' codec can't decode byte 0x8b in position 1: unexpected code byte

它并不总是发生,但我认为没有程序员喜欢这种“随机”的情况。

那么有人可以在这个问题上帮助我吗?有什么问题,我该如何解决?

非常感谢~

4

2 回答 2

24

byte 0x8b in position 1通常表示数据流已被压缩。对于类似的问题,请参见此处此处

解压数据流:

buf = StringIO.StringIO(<response object>.content)
gzip_f = gzip.GzipFile(fileobj=buf)
content = gzip_f.read()
于 2014-12-13T14:44:46.323 回答
1

默认情况下,如果 decode() 遇到不知道如何解码的字节,它将抛出错误。

您可以使用trend.decode('utf-8', 'replace')trend.decode('utf-8', 'ignore')不抛出错误并默默地忽略它。

此处有关 decode() 的文档。

于 2012-08-15T17:15:13.450 回答