3

我想问一下Python程序如何进行以下转换(源->目标)。

>>> source = '\\x{4e8b}\\x{696d}'
>>> print source
\x{4e8b}\x{696d}
>>> print type(source)
<type 'str'>
>>> target = u'\u4e8b\u696d'
>>> print target.encode('utf-8')
事業

谢谢你。

4

3 回答 3

4

您可以使用intandunichr来转换它们:

>>> int('4e8b', 16)
    20107
>>> unichr(int('4e8b', 16))
    u'\u4e8b'
>>> print unichr(int('4e8b', 16))
事
于 2013-03-09T04:45:13.853 回答
4

利用 Blender 的想法,您可以将re.sub与可调用的替换参数一起使用:

import re
def touni(match):
    return unichr(int(match.group(1), 16))

source = '\\x{4e8b}\\x{696d}'
print(re.sub(r'\\x\{([\da-f]+)\}', touni, source))

产量

事業
于 2013-03-09T04:49:34.357 回答
0
import re
p = re.compile(r'[\W\\x]+')
print ''.join([unichr(int(y, 16)) for y in p.split(source) if y != ''])
事業

还从@Blender 偷了主意...

于 2013-03-09T04:52:51.190 回答