1

我有一个允许上传 xls、xlsx 和 csv 格式的电子表格的应用程序。这些数据后来在各种面向客户的地方使用。管理数据的人员使用各种工具来创建电子表格,包括 mac/excel、win/excel、win/openoffice、linux/libreoffice...

真正的问题是 mac/excel 编码,它创建了一些看起来令人讨厌的字符串。有什么方法可以确保文件内容的编码是有效的 utf-8?

我的方法只是 File.read(file.path).valid_encoding?检查仅适用于 csv...

4

1 回答 1

0

我会研究charlock_holmes,这是一个可以让您轻松检测甚至尝试根据文件编码对文件进行转码的 gem。

于 2016-03-24T21:47:11.037 回答