python - python输入UnicodeDecodeError：

Question

蟒蛇3.x

>>> a = input()
hope
>>> a
'hope'
>>> b = input()
håpe
>>> b
'håpe'
>>> c = input()

start typing hå... delete using backspace... and change to hope

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc3 in position 1: invalid continuation byte
>>>

情况并不可怕，我正在解决它，但奇怪的是，在删除时，字节被弄乱了。有没有其他人经历过这个？

终端历史显示它认为我进入了h?ope

有任何想法吗？

在使用它的脚本中，我确实导入readline以提供命令行历史记录。

score 8 · Accepted Answer

看起来退格键正在删除最后一个字节而不是最后一个字符。最终发生的是您键入：

68 c3 a5
h |  å

68 c3 6f 70 65
h |  |o |p |e

在 UTF-8 中，设置了第一位的字节 ( c3) 意味着下一个字节也必须设置其第一位（参见Wikipedia 的描述）。

确保您的终端仿真器和 readline 了解您使用的是 UTF-8。

python - python输入UnicodeDecodeError：

1 回答 1

Related

Reference