我正在编写一个 perl 脚本来解析来自标准输入的制表符分隔数据。
该脚本会删除前导和尾随空格,将任何具有字符串“NULL”的字段清空,并将日期列从“MMM DD YYYY HH:MM:SS:SSSAM”格式重新格式化为“YYYYMMDD”格式。
样本输入:
93092 Apr 1 2010 12:00:00:000AM 59668370.60702875
22341 Apr 1 2010 12:00:00:000AM 51309196.84639429
27844 Apr 1 2010 12:00:00:000AM NULL
150465 Apr 22 2010 12:00:00:000AM 19706190.97586569
119364 Jul 20 2010 12:00:00:000AM 16335977.41009162
目标输出:
93092|20100401|59668370.60702875
22341|20100401|51309196.84639429
27844|20100401|
150465|20100422|19706190.97586569
119364|20100720|16335977.41009162
该脚本接受一个参数,该参数表示具有需要转换的日期的列。在上面的示例中,我会使用“1”作为参数调用,因为第二列是需要转换的日期。多个列将由逗号分隔的列表表示。
这是我迄今为止能够做到的。
#!/usr/bin/perl
my @date_cols = split(/,/, $ARGV[0]);
while (<STDIN>) {
my @fields = split(/\t/, $_, -1);
for (@fields) {
s/^\s+//;
s/\s+\z//;
s/^NULL\z//;
}
for (@fields[@date_cols]) {
##NEED HELP WITH DATE FORMATTING
}
print(join('|', @fields), "\n");
}