python - 意大利语检测为 iso-8859-2

Question

我正在使用 chardet 来检测文本文件的编码，包括意大利语。问题是它始终将它们的编码检测为 iso-8859-2，而正确的检测将是 iso-8859-1。有人知道修复吗？我的本地语言设置为波兰语？会不会影响检测？

score 1 · Accepted Answer

chardet 不支持 iso-8859-1，这就是它没有检测到它的原因。有关支持的字符编码，请参阅 chardets 主页 - http://pypi.python.org/pypi/chardet。

我使用 Linux 程序“文件”来获取不同内容的字符编码，但是我不确定它有多安全，请参阅我的问题 - Python 中的编码检测，是否使用 chardet 库？. 但到目前为止，它对我来说效果很好。

顺便说一句，您的本地语言不应该影响检测。

1 回答 1