0

我一直在处理 Outlook 导入(在导出到 Outlook 格式中链接),但我遇到了编码问题。我通过导出我的 LinkedIn 联系人获得的 Outlook 格式 CSV 不是 UTF-8。调用. ñ_ mongoid_search_ str.to_s.mb_chars.normalize我认为编码是问题,因为当我打电话时mb_chars见第一个代码示例)。我不确定这是否是 gem 中的错误,但我还是被建议清理数据。

在 File Picker 中,我尝试使用他们新的、社区支持的 gem 来上传 CSV 数据。我尝试了三种编码检测器和转码器:

  1. Python 库的 Ruby 端口chardet
    • 没有按预期工作
    • 端口仍然包含 Python 代码,阻止它在我的应用程序中运行
  2. rchardet19宝石
    • 放心检测iso-8859.8/1
    • 尝试使用 Iconv 转码,但在“非法字符”上崩溃ñ
  3. Charlock_Holmes宝石
    • 放心检测windows-1252_33/100
    • rchardet我认为那是实际的编码,并且iso-8859是基于此的。
    • 这个 gem 使用 ICU 并有一个支持 Heroku 的维护分支“bundle-icu”。当我尝试使用 转码时charlock,我收到错误U_FILE_ACCESS_ERROR,ICU 错误代码表示“无法打开文件”

有人知道在这里做什么吗?

4

1 回答 1

2

Ruby 1.9 内置了编码,你试过吗:

s.force_encoding 'utf-8'

mb_chars 是 ruby​​ 1.8 的包装器,因此您不需要它。

见重复

如何使用 ruby​​ 1.9 转换字符编码

于 2012-10-29T21:27:53.593 回答