我有一个属于 html 的文本。我想把它保存到一个文件中。
这在 Eclipse 的调试模式下工作正常,但在 shell 运行时失败。我正在使用一个失败的 html 的简短示例。
xx = '<input type="hidden" name="charset_test" value="€,´,€,´,水,Д,Є" />'
with codecs.open('myfile.htm'), 'wb', encoding="utf-8") as output:
output.write(data)
我得到:
Exception 'ascii' codec can't decode byte 0xe2 in position XXX: ordinal not in range(128)
其中 XXX 是“奇怪”符号(例如 EURO 符号)在相关文件中的位置。
为什么这在 Eclipse 而不是 shell 中工作?我该如何解决这个问题?
我试过了
HTMLParser.HTMLParser().unescape()
unquote()
unicode()
没有任何效果...