如果解码失败时出现异常,我们可以一一尝试检测文件编码。
但是我没有找到一种方法会在 python 中抛出一些异常,比如'UnicodeDecodeError',有什么具体原因吗?
PS:当某些字节映射到未定义的字符时,解码过程会失败,因为大多数编码方案都留下了一些未编码的冗余码。
PPS:我问这个问题是因为我认为这是一个设计问题。我没有关于编码的问题。但是当我想像 Vim(文本编辑器)那样编写一些代码来自动检测文件编码时,我发现这种设计让事情变得很困难。
如果解码失败时出现异常,我们可以一一尝试检测文件编码。
但是我没有找到一种方法会在 python 中抛出一些异常,比如'UnicodeDecodeError',有什么具体原因吗?
PS:当某些字节映射到未定义的字符时,解码过程会失败,因为大多数编码方案都留下了一些未编码的冗余码。
PPS:我问这个问题是因为我认为这是一个设计问题。我没有关于编码的问题。但是当我想像 Vim(文本编辑器)那样编写一些代码来自动检测文件编码时,我发现这种设计让事情变得很困难。