1

我有一堆文件,其中包含以下 csv 格式的一堆引号:

"Date","Time","Open","High","Low","Close","Volume"
12/30/2002,0930,24.53,24.65,24.53,24.65,762200
12/30/2002,0931,24.65,24.68,24.52,24.6,90400

我需要将文件转换为具有几乎相同名称的新文件(例如 file.txt 到 file-NTF.txt),如下所示:

"Date Time","Open","High","Low","Close","Volume"
20021230 093000;24.53;24.65;24.53;24.65;762200
20021230 093100;24.65;24.68;24.52;24.6;90400

所以日期和时间列合并为一个,日期的格式不同是不同的。逗号也变成了分号。我在 awk 中走了这么远

awk -F "," '{print $1,$2}' file.txt

这将打印原始文件的日期和时间,但现在我被卡住了。

4

3 回答 3

2

使用GNU awk

awk 'NR>1{print $3$1$2" "$4"00",$5,$6,$7,$8,$9;next}{sub(/","/," ")}1' FS='[/,]' OFS=';' file
"Date Time","Open","High","Low","Close","Volume"
20021230 093000;24.53;24.65;24.53;24.65;762200
20021230 093100;24.65;24.68;24.52;24.6;90400
于 2013-07-27T22:48:58.273 回答
0

尝试

awk -F, 'BEGIN{
  print "\"Date Time\";\"Open\";\"High\";\"Low\";\"Close\";\"Volume\""
}
NR>1 {
  printf("%04d%02d%02d %04d00;%s;%s;%s;%s\n", \
    substr($1,7,4), substr($1,1,2), substr($1,4,2),  $2, \
    $3, $4, $5, $6 $7)
}' file

输出

"Date Time";"Open";"High";"Low";"Close";"Volume"
20021230 093000;24.53;24.65;24.53;24.65762200
20021230 093100;24.65;24.68;24.52;24.690400

我冒昧地使用了您在示例输出记录中显示的字段分隔符,并在标题中也使用了它。逗号作为分隔符很麻烦,IHMO。

IHTH

于 2013-07-27T22:47:18.507 回答
0

这可能对您有用(GNU sed):

sed -r '1{s/","/ /;b};s/^(..).(..).(....).(....)/\3\1\2 \400/;y/,/;/' file

对于第一行,仅用空格替换第一个双引号,逗号双引号。

对于第二行和后续行,应用替换和翻译。

但是,要用分号替换所有逗号,请使用:

sed -r '1s/","/ /;1!s/^(..).(..).(....).(....)/\3\1\2 \400/;y/,/;/' file
于 2013-07-28T06:42:37.100 回答