我使用 python 2.7,我从服务器接收一个字符串(不是 unicode!)。在该字符串中,我找到带有 unicode 转义序列的文本。例如像这样:
<a href = "http://www.mypage.com/\u0441andmoretext">\u00b2<\a>
如何将它们转换\uxxxx
回 utf-8?我找到的答案要么正在处理,要么是&#
必需eval()
的,这对我的目的来说太慢了。对于任何包含此类序列的文本,我都需要一个通用的解决方案。
编辑:
<\a>
是一个错字,但我也想容忍这种错字。应该只有反应\u
示例文本以正确的 Python 语法表示,如下所示:
"<a href = \"http://www.mypage.com/\\u0441andmoretext\">\\u00b2<\\a>"
所需的输出采用正确的 python 语法
"<a href = \"http://www.mypage.com/\xd1\x81andmoretext\">\xc2\xb2<\\a>"