python - 从 HBase 解码 HappyBase 数据

Question

在尝试从 HBase 解码值时，我看到一个错误，但很明显 Python 认为它不是 UTF-8 格式，而是将数据放入 HBase 的 Java 应用程序仅将其编码为 UTF-8

a = '\x00\x00\x00\x00\x10j\x00\x00\x07\xe8\x02Y' a.decode("UTF-8") Traceback（最近一次调用最后）：文件“”，第 1 行，在文件“/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/encodings/utf_8.py”，第 16 行，在 decode return codecs.utf_8_decode(input, errors, True) UnicodeDecodeError: 'utf8 ' 编解码器无法解码位置 9 中的字节 0xe8：无效的继续字节

有什么想法吗？

score 0 · Accepted Answer

该数据不是有效的 utf-8，所以如果你真的从数据库中检索到它，你应该检查是谁/什么把它放在那里。

python - 从 HBase 解码 HappyBase 数据

1 回答 1

Related

Reference