1

我有一个由 thorn 字符分隔的 CSV 文件。我可以:

CSV.foreach(file_path, { encoding:'ISO8859-1', :col_sep => "þ" }) do |row|

但我希望安全地解析我的文件并使用 unicode 版本的 thorn 分隔列。

我认为我在通话中尝试不同的选项是正确的,例如:

CSV.foreach(file_path, { encoding:'unicode', :col_sep => "U+00DE" }) do |row|

但我想不通...

我应该如何在 Ruby 中做到这一点?

谢谢

4

1 回答 1

1

这有效:

CSV.foreach(file_path, { encoding:'ISO-8859-1', :col_sep => "\u00FE" }) do |row|

谢谢@phoet

解决了这个问题,做:

Encoding.name_list.each do |encoding|
  CSV.foreach(file_path, { encoding:encoding, :col_sep => "\u00FE" }) do |row|
    puts row.inspect
    break
  end
end

乐趣

于 2013-10-08T19:11:50.363 回答