0

我想知道 rchardet 是否支持 ISO-8859-1 和 Windows-1252 的编码。我已经看过文档,但我没有得到关于这方面的正确信息。

4

1 回答 1

2

我不知道 chardet gem,但在https://github.com/jmhodges/rchardet上阅读代码 5 分钟后找到了答案。

  • 各种探测器都支持 UTF-8,包括UniversalDetectorUTF8Prober
  • ASCII 是 UTF-8、Latin-1 等的子集。是直接检测到的UniversalProber
  • Latin1Prober支持 ISO-8859-1(也称为 Latin-1)
  • . Windows-1252 与 Latin-1 非常相似(这取决于不可区分的数据)也受Latin1Prober.

至于您的一般问题,您应该养成阅读您使用的 gem 的代码而不是文档的习惯。不仅有助于它理解 gem 的作用,它还极大地有助于理解它是如何做到这一点的,以及它做得好的和不好的地方。此外,阅读代码使您始终成为更好的程序员。

于 2014-09-30T07:51:44.230 回答