1

我有大约 50 个 CSV 文件需要水平合并为一个 CSV。

标题可以忽略。稍微简化一下文件如下所示:

文件 1:

1,2,4,5,6
4,5,68,7,4,2
1,2

1,2,3

文件 2:

1,2,4
4,5,6,4
3,4,5
3,4,5

输出应如下所示:

1,2,4,5,6,1,2,4
4,5,68,7,4,2,4,5,6,4
1,2,3,4,5
3,4,5
1,2,3

合并文件的顺序也不重要。我知道如何垂直合并它们,但我不知道如何水平合并。我想过这样的嵌套数组,但它不起作用,但我不知道为什么。数据阵列似乎不接受线阵列。

#!/usr/bin/env ruby
require 'csv'
data = Array.new
filecount=1
linecount=1

CSV.open("output.csv", "wb") do |output|
  Dir.glob('*.csv').each do |each|
    next if each == 'output.csv'
    file = CSV.read(each)
    file.each do |line|
      data[filecount][linecount] = line
      linecount=linecount+1
    end
    filecount=filecount+1
  end
end

puts data
4

1 回答 1

2

我准备了一个小脚本来解决您的问题,并添加了一些注释以便更好地解释。

主要思想是逐行捕获输入,因此您不必使用太多内存。

#!/usr/bin/env ruby
require 'csv'

# map "treats" each element of the array with the block
files = Dir.glob('csv/*.csv').map { |file| CSV.open file, 'r' }

CSV.open("output.csv", "wb") do |out|
    loop do
        # shift returns the next line
        # compact remove nil entries
        line = files.map { |file| file.shift }.compact
        # remove entry if file has no row
        line.reject! { |e| e.empty? }
        # break the endless loop if no input to handle
        break if line.empty?
        out << line.flatten
    end
end
于 2013-03-04T17:52:47.517 回答