我一直在处理 Outlook 导入(在导出到 Outlook 格式中链接),但我遇到了编码问题。我通过导出我的 LinkedIn 联系人获得的 Outlook 格式 CSV 不是 UTF-8。调用. ñ
_ mongoid_search
_ str.to_s.mb_chars.normalize
我认为编码是问题,因为当我打电话时mb_chars
(见第一个代码示例)。我不确定这是否是 gem 中的错误,但我还是被建议清理数据。
在 File Picker 中,我尝试使用他们新的、社区支持的 gem 来上传 CSV 数据。我尝试了三种编码检测器和转码器:
- Python 库的 Ruby 端口
chardet
- 没有按预期工作
- 端口仍然包含 Python 代码,阻止它在我的应用程序中运行
rchardet19
宝石- 放心检测
iso-8859
。.8/1
- 尝试使用 Iconv 转码,但在“非法字符”上崩溃
ñ
- 放心检测
Charlock_Holmes
宝石- 放心检测
windows-1252
_33/100
rchardet
我认为那是实际的编码,并且iso-8859
是基于此的。- 这个 gem 使用 ICU 并有一个支持 Heroku 的维护分支“bundle-icu”。当我尝试使用 转码时
charlock
,我收到错误U_FILE_ACCESS_ERROR
,ICU 错误代码表示“无法打开文件”
- 放心检测
有人知道在这里做什么吗?