我正在使用 chardet 来检测文本文件的编码,包括意大利语。问题是它始终将它们的编码检测为 iso-8859-2,而正确的检测将是 iso-8859-1。有人知道修复吗?我的本地语言设置为波兰语?会不会影响检测?
问问题
464 次
1 回答
1
chardet 不支持 iso-8859-1,这就是它没有检测到它的原因。有关支持的字符编码,请参阅 chardets 主页 - http://pypi.python.org/pypi/chardet。
我使用 Linux 程序“文件”来获取不同内容的字符编码,但是我不确定它有多安全,请参阅我的问题 - Python 中的编码检测,是否使用 chardet 库?. 但到目前为止,它对我来说效果很好。
顺便说一句,您的本地语言不应该影响检测。
于 2012-11-27T21:30:28.777 回答