8

我正在导入一个包含需要转换的字段的 CSV 文件,如下所示:

  • “真”(字符串)-> 真(布尔)
  • “假”(字符串)-> 假(布尔)
  • “%m/%d/%Y”(字符串格式)-> 日期对象
  • “%m/%d/%Y %I:%M:%S %p”(字符串格式)-> DateTime 对象

默认 CSV 转换器与 Date 和 DateTime 字段不匹配。下面的这种方法似乎有效,但想知道是否有更好的方法,可能通过覆盖转换器使用的匹配模式?

 require 'csv'
 require 'date'

 src = <<csv
 active,date_created,date_modified
 "True","03/12/2012","03/12/2012 2:14:23 PM"
 "False","01/25/2011","03/12/2013 3:14:27 AM"
 csv

 CSV::Converters[:my_converters] = lambda{|field| 
   begin 
     case field.to_s
       when "True"
         true
       when "False"
         false
       when /^\d{2}\/\d{2}\/\d{4}$/
         Date.strptime(field,"%m/%d/%Y")
       else
         DateTime.strptime(field,"%m/%d/%Y %I:%M:%S %p")
       end
   rescue ArgumentError
     field
   end
 }

 csv = CSV(src, :headers => true, :converters => [:my_converters])
 csv.each{|row| puts row}

是的,2012-03-12,2012-03-12T14:14:23+00:00

假,2011-01-25,2013-03-12T03:14:27+00:00

4

2 回答 2

9

相应地转换字段字段名称(标题名称)

custom_converter = lambda { |value, field_info|
  case field_info.header
  when 'OrderUuid', 'Exchange', 'Type', 'OrderType'
    value.to_s
  when 'Quantity', 'Limit', 'CommissionPaid', 'Price'
    value.to_f
  when 'Opened', 'Closed'
    Time.zone.parse(value)
  else
    fail("Unknown field name #{field_info.inspect}=#{value}")
  end
}

CSV.parse(content, headers: :first_row, converters: [custom_converter]).map(&:to_h)
于 2018-07-08T16:17:31.547 回答
5

如果默认转换器不够用,这是做事的正确方法。我唯一的建议是将您的转换器分成不同的 lambda,因为 CSV 库已经设计为针对一组转换器测试每个字段(使您case变得多余)。

但是,如果这只是一个快速的一次性脚本,那么您所拥有的就足够了。

于 2013-10-09T12:58:14.127 回答