我需要在 Ruby 中检测文件类型和编码。
我目前正在通过魔法gem 使用 libmagic,但它有一个问题:如果 UTF-16 文件没有 BOM,它就不会检测到它们。这是此类文件的一个示例。
$ file -i text_without_bom.txt
text_without_bom.txt: application/octet-stream; charset=binary
我可以使用任何其他库或方法来正确检测 UTF-16 文件吗?
PS 还尝试了 rchardet和charlock_holmes,但运气不佳。