perl - 将文件从使用一种日期格式转换为另一种

Question

我有一堆文件，其中包含以下 csv 格式的一堆引号：

"Date","Time","Open","High","Low","Close","Volume"
12/30/2002,0930,24.53,24.65,24.53,24.65,762200
12/30/2002,0931,24.65,24.68,24.52,24.6,90400

我需要将文件转换为具有几乎相同名称的新文件（例如 file.txt 到 file-NTF.txt），如下所示：

"Date Time","Open","High","Low","Close","Volume"
20021230 093000;24.53;24.65;24.53;24.65;762200
20021230 093100;24.65;24.68;24.52;24.6;90400

所以日期和时间列合并为一个，日期的格式不同是不同的。逗号也变成了分号。我在 awk 中走了这么远

awk -F "," '{print $1,$2}' file.txt

这将打印原始文件的日期和时间，但现在我被卡住了。

score 2 · Accepted Answer

使用GNU awk：

awk 'NR>1{print $3$1$2" "$4"00",$5,$6,$7,$8,$9;next}{sub(/","/," ")}1' FS='[/,]' OFS=';' file
"Date Time","Open","High","Low","Close","Volume"
20021230 093000;24.53;24.65;24.53;24.65;762200
20021230 093100;24.65;24.68;24.52;24.6;90400

score 0 · Accepted Answer

尝试

awk -F, 'BEGIN{
  print "\"Date Time\";\"Open\";\"High\";\"Low\";\"Close\";\"Volume\""
}
NR>1 {
  printf("%04d%02d%02d %04d00;%s;%s;%s;%s\n", \
    substr($1,7,4), substr($1,1,2), substr($1,4,2),  $2, \
    $3, $4, $5, $6 $7)
}' file

输出

"Date Time";"Open";"High";"Low";"Close";"Volume"
20021230 093000;24.53;24.65;24.53;24.65762200
20021230 093100;24.65;24.68;24.52;24.690400

我冒昧地使用了您在示例输出记录中显示的字段分隔符，并在标题中也使用了它。逗号作为分隔符很麻烦，IHMO。

IHTH

score 0 · Accepted Answer

这可能对您有用（GNU sed）：

sed -r '1{s/","/ /;b};s/^(..).(..).(....).(....)/\3\1\2 \400/;y/,/;/' file

对于第一行，仅用空格替换第一个双引号，逗号双引号。

对于第二行和后续行，应用替换和翻译。

但是，要用分号替换所有逗号，请使用：

sed -r '1s/","/ /;1!s/^(..).(..).(....).(....)/\3\1\2 \400/;y/,/;/' file

perl - 将文件从使用一种日期格式转换为另一种

3 回答 3

Related

Reference