我想知道 rchardet 是否支持 ISO-8859-1 和 Windows-1252 的编码。我已经看过文档,但我没有得到关于这方面的正确信息。
问问题
104 次
1 回答
2
我不知道 chardet gem,但在https://github.com/jmhodges/rchardet上阅读代码 5 分钟后找到了答案。
- 各种探测器都支持 UTF-8,包括UniversalDetector和UTF8Prober
- ASCII 是 UTF-8、Latin-1 等的子集。是直接检测到的
UniversalProber
。 - Latin1Prober支持 ISO-8859-1(也称为 Latin-1)
- . Windows-1252 与 Latin-1 非常相似(这取决于不可区分的数据)也受
Latin1Prober
.
至于您的一般问题,您应该养成阅读您使用的 gem 的代码而不是文档的习惯。不仅有助于它理解 gem 的作用,它还极大地有助于理解它是如何做到这一点的,以及它做得好的和不好的地方。此外,阅读代码使您始终成为更好的程序员。
于 2014-09-30T07:51:44.230 回答