我正在使用 Ruby 从 csv 文件中提取某些数据,并且我想通过删除不需要的字符来清理提取的字符串。
到目前为止,这是我提取数据的方式:
CSV.foreach(data_file, :encoding => 'windows-1251:utf-8', :headers => true) do |row|
#create an array for each page
page_data = []
#For each page, get the data we are interested in and save it to the page_data
page_data.push(row['dID'])
page_data.push(row['xTerm'])
pages_to_import.push(page_data)
然后我用提取的数据输出 csv 文件
提取的输出与 csv 数据文件中的输出完全相同:
| ID | Term |
|-------|-----------------------------------------|
| 13241 | @@106#107#my@@106#term@@ |
| 13345 | @@63#hello@@ |
| 11436 | @@55#rock@@20#my@@10015#18#world@@ |
但是,我想要达到的理想结果是:
| ID | Term |
|-------|-----------------------------------------|
| 13241 | my, term |
| 13345 | hello |
| 11436 | rock, my, world |
关于如何实现这一目标的任何建议?
我使用的库:
require 'nokogiri'
require 'cgi'
require 'csv'