3

在尝试从 HBase 解码值时,我看到一个错误,但很明显 Python 认为它不是 UTF-8 格式,而是将数据放入 HBase 的 Java 应用程序仅将其编码为 UTF-8

a = '\x00\x00\x00\x00\x10j\x00\x00\x07\xe8\x02Y' a.decode("UTF-8") Traceback(最近一次调用最后):文件“”,第 1 行,在文件“/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/encodings/utf_8.py”,第 16 行,在 decode return codecs.utf_8_decode(input, errors, True) UnicodeDecodeError: 'utf8 ' 编解码器无法解码位置 9 中的字节 0xe8:无效的继续字节

有什么想法吗?

4

1 回答 1

0

该数据不是有效的 utf-8,所以如果你真的从数据库中检索到它,你应该检查是谁/什么把它放在那里。

于 2016-07-01T15:37:56.857 回答