我正在尝试打印一个没有特定编码十六进制的 unicode 字符串。我正在从 facebook 获取这些数据,该数据在 UTF-8 的 html 标头中具有编码类型。当我打印类型时 - 它说它的 unicode,但是当我尝试使用 unicode-escape 对其进行解码时说存在编码错误。为什么当我使用解码方法时它试图编码?
代码
a='really long string of unicode html text that i wont reprint'
print type(a)
>>> <type 'unicode'>
print a.decode('unicode-escape')
>>> Traceback (most recent call last):
File "scfbp.py", line 203, in myFunctionPage
print a.decode('unicode-escape')
UnicodeEncodeError: 'ascii' codec can't encode character u'\u20ac' in position 1945: ordinal not in range(128)