我有一个允许上传 xls、xlsx 和 csv 格式的电子表格的应用程序。这些数据后来在各种面向客户的地方使用。管理数据的人员使用各种工具来创建电子表格,包括 mac/excel、win/excel、win/openoffice、linux/libreoffice...
真正的问题是 mac/excel 编码,它创建了一些看起来令人讨厌的字符串。有什么方法可以确保文件内容的编码是有效的 utf-8?
我的方法只是 File.read(file.path).valid_encoding?检查仅适用于 csv...