0

对 Ruby 来说相对较新,我试图弄清楚如何使用 FasterCSV 执行以下操作:打开一个 CSV 文件,按标题选择一列,在此列中仅将所有出现的字符串 x 替换为 y,写出新文件到标准输出。以下代码几乎可以工作:

filename = ARGV[0]
csv = FCSV.read(filename, :headers => true, :header_converters => :symbol, :return_headers => true, :encoding => 'u') 
mycol = csv[:mycol]
# construct a mycol_new by iterating over mycol and doing some string replacement
puts csv[:mycol][0] # produces "MyCol" as expected
puts mycol_new[0] # produces "MyCol" as expected
csv[:mycol] = mycol_new
puts csv[:mycol][0] # produces "mycol" while "MyCol" is expected
csv.each do |r|
  puts r.to_csv(:force_quotes => true)
end

唯一的问题是有一个我不期望的标题转换。如果所选列的标题在替换 csv 表中的列之前是“MyCol”,那么之后是“mycol”(参见代码中的注释)。为什么会这样?以及如何避免?谢谢。

4

2 回答 2

4

您可以在初始化行中进行一些更改,这会有所帮助。改变:

csv = FCSV.read(filename, :headers => true, :return_headers => true, :encoding => 'u') 

到:

csv = FCSV.read(filename, :headers => true, :encoding => 'u') 

我正在使用 CSV,它是 FasterCSV,只是它是 Ruby 1.9 的一部分。这将在当前目录中创建一个名为“temp.csv”的 CSV 文件,其中包含修改后的“FName”字段:

require 'csv'

data = "ID,FName,LName\n1,mickey,mouse\n2,minnie,mouse\n3,donald,duck\n"

# read and parse the data
csv_in = CSV.new(data, :headers => true)

# open the temp file
CSV.open('./temp.csv', 'w') do |csv_out|

  # output the headers embedded in the object, then rewind to the start of the list
  csv_out << csv_in.first.headers
  csv_in.rewind

  # loop over the rows
  csv_in.each do |row|

    # munge the first name
    if (row['FName']['mi'])
      row['FName'] = row['FName'][1 .. -1] << '-' << row['FName'][0] << 'ay'
    end

    # output the record
    csv_out << row.fields
  end
end

输出如下所示:

ID,FName,LName
1,ickey-may,mouse
2,innie-may,mouse
3,donald,duck
于 2010-12-14T06:57:19.417 回答
3

可以直接在 FasterCSV 对象中操作所需的列,而不是创建一个新列,然后尝试用新列替换旧列。

csv = FCSV.read(filename, :headers => true, :header_converters => :symbol, :return_headers => true, :encoding => 'u')
mycol = csv[:my_col]
mycol.each do |row|
  row.gsub!(/\s*;\s*/,"///") unless row.nil? # or any other substitution
csv.each do |r|
  puts r.to_csv(:force_quotes => true)
end
于 2010-12-17T08:19:40.727 回答