python - 在 Python 2.6 中用对应的 utf-8 字符替换 html 实体

Question

我有一个这样的html文本：

&lt;xml ... &gt;

我想把它转换成可读的东西：

<xml ...>

在 Python 中有什么简单（快速）的方法吗？

score 25 · Accepted Answer

蟒蛇> = 3.4

官方文档HTMLParser：Python 3

>>> from html import unescape
>>> unescape('&copy; &euro;')
© €

官方文档HTMLParser：Python 3

>>> from html.parser import HTMLParser
>>> pars = HTMLParser()
>>> pars.unescape('&copy; &euro;')
© €

注意：这已被弃用，有利于html.unescape().

官方文档HTMLParser：Python 2.7

>>> import HTMLParser
>>> pars = HTMLParser.HTMLParser()
>>> pars.unescape('&copy; &euro;')
u'\xa9 \u20ac'
>>> print _
© €

score 2 · Accepted Answer

现代 Python 3 方法：

>>> import html
>>> html.unescape('&copy; &euro;')
© €

score 1 · Accepted Answer

正如 Fred 指出的帖子所链接的那样，这里有一个功能可以做到这一点。复制到这里是为了让事情变得更容易。

感谢 Fred Larson 链接到关于 SO 的另一个问题。感谢 dF 发布链接。