我有一个这样的html文本:
<xml ... >
我想把它转换成可读的东西:
<xml ...>
在 Python 中有什么简单(快速)的方法吗?
我有一个这样的html文本:
<xml ... >
我想把它转换成可读的东西:
<xml ...>
在 Python 中有什么简单(快速)的方法吗?
官方文档HTMLParser
:Python 3
>>> from html import unescape
>>> unescape('© €')
© €
官方文档HTMLParser
:Python 3
>>> from html.parser import HTMLParser
>>> pars = HTMLParser()
>>> pars.unescape('© €')
© €
注意:这已被弃用,有利于html.unescape()
.
官方文档HTMLParser
:Python 2.7
>>> import HTMLParser
>>> pars = HTMLParser.HTMLParser()
>>> pars.unescape('© €')
u'\xa9 \u20ac'
>>> print _
© €
现代 Python 3 方法:
>>> import html
>>> html.unescape('© €')
© €
正如 Fred 指出的帖子所链接的那样,这里有一个功能可以做到这一点。复制到这里是为了让事情变得更容易。
感谢 Fred Larson 链接到关于 SO 的另一个问题。感谢 dF 发布链接。