2

我试图编码但没有成功。

text = "don\\u2019t think"
textencode = text.encode('utf-8').split(" ")
print textencode

结果还是 ['don\u2019t', 'think']

我试图得到 ['don't', 'think']

有什么建议吗?

4

2 回答 2

3

看起来你正在使用 Python2。这是你想要的?

>>> text = u"don\u2019t think"
>>> textencode = text.encode('utf-8').split(" ")
>>> print textencode[0]
don’t

Python3 更好地处理 unicode 对象

>>> text = "don\u2019t think"
>>> textencode = text.split(" ")
>>> textencode
['don’t', 'think']
于 2013-03-07T15:32:46.940 回答
-1

在 python 2.x 中

>>> text = u"don\u2019t think"
>>> textencode = text.encode('utf-8').split(" ")
>>> print textencode
['don\xe2\x80\x99t', 'think']
>>> print textencode[0]
don’t

在双引号前添加前缀 'u'。

于 2013-03-07T15:37:34.257 回答