对于以下使用的行urllib
:
# some request object exists
response = urllib.request.urlopen(request)
html = response.read().decode("utf8")
返回什么格式的字符串read()
?我一直试图从 Python 的文档中弄清楚这一点,但它根本没有提到它。为什么有一个decode
?是否decode
将对象解码为utf-8 或从utf-8?它从什么格式解码成什么格式?decode
文档也没有提及这一点。是 Python 的文档那么糟糕,还是我不了解一些标准约定?
我想将该 HTML 存储在 UTF-8 文件中。我只是做一个常规的写,还是我需要“编码”回一些东西并写出来?
注意:我知道 urllib 已被弃用,但我现在无法切换到 urllib2