由于 C 扩展中的一些错误,我正在获取带有 str 实例的 unicode 数据,或者换句话说,str 根本没有编码和 unicode 文字。
因此,例如,这是一个有效的 unicode 文字
>>> u'\xa1Se educado!'
UTF-8 编码的 str 将是:
>>> '\xc2\xa1Se educado!'
但是,我得到一个带有 unicode 文字的 str :
>>> '\xa1Se educado!'
我需要从中创建一个 unicode 实例。使用unicode()
不起作用,因为它需要编码。我认为这可以满足''.join(unichr(ord(x)) for x in s)
我的需求,但这真的很难看。必须有更好的解决方案。有任何想法吗?