UTF8 中 '\x80' 占用多少字节?
在 Python 中,我写:
>>> '\x80'.encode('utf8')
b'\xc2\x80'
这表明 '\x80' 转换为两个字节。
另外,反过来:
>>> b'\x80'.decode()
>>> Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 0: invalid start byte
这是否意味着字节'\x80' 本身在 UTF-8 中没有(字符)含义?