我正在尝试解码以下列方式编码的聊天:
&#number;
我试过了:
s.decode("utf8")
和:
s.decode("unicode-escape")
但两者似乎都不起作用。
我应该使用什么编码来解码这种类型?
一般来说 - 我在哪里可以找到所有有效编码的列表?
蟒蛇2:
import HTMLParser
h = HTMLParser.HTMLParser()
print h.unescape('£682m')
£682m
蟒蛇3:
import html.parser
h = html.parser.HTMLParser()
print(h.unescape('£682m'))
£682m
.encode 和 .decode 的工作方式有点不同,恐怕你所期望的。请参阅以下内容:
print 'å'.decode('iso-8859-1')
u'\x86'
å
当我将字符串输入控制台(
有关字符编码的更多信息:http ://en.wikipedia.org/wiki/Character_encoding