12

我有下一部分代码:

In [8]: st = u"опа"

In [11]: st.encode("ascii", "xmlcharrefreplace")
Out[11]: 'опа'

In [14]: st1 = st.encode("ascii", "xmlcharrefreplace")

In [15]: st1.decode("ascii", "xmlcharrefreplace")
Out[15]: u'опа'

In [16]: st1.decode("utf-8", "xmlcharrefreplace")
Out[16]: u'опа'

你知道如何转换st1u"опа"吗?

4

1 回答 1

23

使用html.unescape()函数(Python 3.4 和更新版本):

>>> import html
>>> html.unescape('опа')
'опа'

在旧版本(包括 Python 2)上,您必须使用以下实例HTMLParser.HTMLParser()

>>> from HTMLParser import HTMLParser
>>> parser = HTMLParser()
>>> parser.unescape('опа')
u'\u043e\u043f\u0430'
>>> print parser.unescape('опа')
опа
于 2013-06-27T11:18:53.883 回答