好的,所以我正在尝试编写一个简单的 awk 来清除我拥有的一些 csv 文件的一些逗号。
这是几行示例数据
PRD,,,,PEWPRV100D,,,EWPRVU457D,,,,12/31/2011 10:09:14 PM,,,,,5,,,4,,
PRD,,,,PEWPRV100D,,,EWPRVU250D,,,,12/31/2011 10:09:23 PM,,,,,67,,,69,,
PRD,,,,PEWREF100D,,,EWREFU045D,,,,12/31/2011 10:09:40 PM,,,,,7,,,5,,
PRD,,,,PEWPRV100D,,,EWPRVU191D,,,,12/31/2011 10:09:40 PM,,,,,6,,,5,,
作为一个简单的第一步,我想执行此操作(我最终想要做的更复杂,但这是我需要做的第一件事,我什至无法做到这一点:()
PRD,PEWPRV100D,EWPRVU457D,12/31/2011 10:09:14 PM,5,4,
PRD,PEWPRV100D,EWPRVU250D,12/31/2011 10:09:23 PM,67,69,
PRD,PEWREF100D,EWREFU045D,12/31/2011 10:09:40 PM,7,5,
PRD,PEWPRV100D,EWPRVU191D,12/31/2011 10:09:40 PM,6,5,
这是我第一次尝试 awk 脚本
#!/bin/awk
BEGIN{FS=",";}
{print $0,$4,$7,$11,$16,$19 }
END{print "DONE"}
产生
PRD,,,,PEWPRV100D,,,EWPRVU457D,,,,12/31/2011 10:09:14 PM,,,,,5,,,4,,,,,,,
PRD,,,,PEWPRV100D,,,EWPRVU250D,,,,12/31/2011 10:09:23 PM,,,,,67,,,69,,,,,,,
PRD,,,,PEWREF100D,,,EWREFU045D,,,,12/31/2011 10:09:40 PM,,,,,7,,,5,,,,,,,
PRD,,,,PEWPRV100D,,,EWPRVU191D,,,,12/31/2011 10:09:40 PM,,,,,6,,,5,,,,,,,
我试过一个更有说服力的脚本:
#!/bin/awk
BEGIN{FS=",";}
{printf("$$%s$$", $0) }
END{print "DONE"}
产生
$$PRD,,,,PEWPRV100D,,,EWPRVU457D,,,,12/31/2011 10:09:14 PM,,,,,5,,,4,,$$
$$PRD,,,,PEWPRV100D,,,EWPRVU250D,,,,12/31/2011 10:09:23 PM,,,,,67,,,69,,$$
$$PRD,,,,PEWREF100D,,,EWREFU045D,,,,12/31/2011 10:09:40 PM,,,,,7,,,5,,$$
$$PRD,,,,PEWPRV100D,,,EWPRVU191D,,,,12/31/2011 10:09:40 PM,,,,,6,,,5,,$$
显示(我认为) FS="," 没有将分隔符设置为逗号,因为整行被视为一列。我也尝试了该行的许多不同形式,似乎没有任何区别。awk 实现的手册页说 FS 是我应该设置的 var。我也尝试过 hte -F 标志,这也没有帮助。
我在这里有什么明显的遗漏吗?