3

我有一个看起来像这样的字符串。

st = '/M\xe4rzen'

我想将其转换为 unicode。我怎样才能做到这一点?我试过了:

st.decode('utf-8')
unicode(t, 'utf-8')

原始文件是 utf-8 编码的,但我似乎无法获得字符串的 unicode 表示。

4

1 回答 1

11

您的数据不是 UTF8 编码的;更有可能是使用 Latin-1 编码:

>>> print st.decode('latin1')
/Märzen

调用.decode()就够了,不需要调用unicode()

于 2013-03-26T12:47:25.460 回答