我有一个字符串:
\xe2\x80\x8e\xd7\x93\xd7\x9c\xd7\x99\xd7\xaa\xe2\x80\x8e
想用 python 把它改成 unicode
我怎么做?
那已经是UTF-8 数据了;python 正在向您展示字符串文字形式。
>>> print '\xe2\x80\x8e\xd7\x93\xd7\x9c\xd7\x99\xd7\xaa\xe2\x80\x8e'.decode('utf8')
דלית
上面的行将 UTF-8 数据解码为unicode
带有.decode('utf8') and prints that; the
print statement inspects the encoding used by my terminal and re-encodes the
unicode` 对象的对象,以便我的终端可以正确显示它。
你可能想阅读 Python 和 Unicode:
Python Unicode HOWTO
Ned Batchelder 的实用 Unicode
每个软件开发人员绝对、绝对必须了解 Unicode 和字符集(没有任何借口!)作者:Joel Spolsky