1

我需要在 Ruby 中检测文件类型和编码。

我目前正在通过魔法gem 使用 libmagic,但它有一个问题:如果 UTF-16 文件没有 BOM,它就不会检测到它们。是此类文件的一个示例。

$ file -i text_without_bom.txt
text_without_bom.txt: application/octet-stream; charset=binary

我可以使用任何其他库或方法来正确检测 UTF-16 文件吗?

PS 还尝试了 rchardetcharlock_holmes,但运气不佳。

4

2 回答 2

2
于 2019-02-20T20:28:22.143 回答
-1

您可以随时切断 BOM 并在没有它的情况下处理文件。 描述了它是如何完成的。

于 2019-02-20T18:48:48.640 回答