嗨,我有一个包含以下条目的 csv 文件
11
22
13
,,
aa
bb
cc
,,
ww
kk
ll
,,
请向我建议一个 linux 命令或脚本,它可以将此 colomun 拆分为同一文件中的 3 列,如下所示
11 aa ww
22 bb kk
13 cc ll
你可以用awk
.
创建一个名为 的文件script.awk
,其内容如下:
BEGIN {
line = 0; #Initialize at zero
}
/,,/ { #every time we hit the delimiter
line = 0; #reset line to zero
}
!/,,/{ #otherwise
a[line] = a[line]" "$0; # Add the new input line to the output line
line++; # increase the counter by one
}
END {
for (i in a )
print a[i] # print the output
}
像这样运行文件:
awk -f test.awk < datafile
输出:
$ cat datafile
11
22
13
,,
aa
bb
cc
,,
ww
kk
ll
,,
$ awk -f script.awk < datafile
11 aa ww
22 bb kk
13 cc ll
或者,如果您只想要一个单线,请执行以下操作:
awk 'BEGIN{line=0;}/,,/{line=0;}!/,,/{a[line++]=a[line]" "$0;}END{for (i in a ) print a[i]}' datafile
编辑:
这将在字段之间添加逗号:
awk 'BEGIN{line=0;}/,,/{line=0;}!/,,/{a[line++]=a[line]?a[line]","$0:$0;}END{for (i in a ) print a[i]}' datafile
# ^ This is the part that I changed
这是一个很好的疯狂的 shell 管道,它实际上做了 OP 想要的:!
#% cat t
11
22
13
,,
aa
bb
cc
,,
ww
kk
ll
,,
然后
#% pr -t -3 -l 4 -s' ' t | sed '$d'
11 aa ww
22 bb kk
13 cc ll
我敢肯定有更好的命令而不诉诸代码。
编辑感谢@user000001 提醒我的错误,让我重新审视我的解决方案。
这可能对您有用:
pr -tT3 -s\ file | sed \$d
用 awk
awk 'BEGIN {RS=",,\n"; FS="[\n]"}{ }{a=a$1" ";b=b$2" ";c=c$3" ";} END{print a"\n"b"\n"c}' temp.txt
输出
11 aa ww
22 bb kk
13 cc ll
perl -lne 'if(/,,/){$.=0}$a{$.}=$a{$.}." ".$_ if($.!=0);END{foreach (sort keys %a){print $a{$_}}}'
测试如下:
> cat temp
11
22
13
,,
aa
bb
cc
,,
ww
kk
ll
,,
> perl -lne 'if(/,,/){$.=0}$a{$.}=$a{$.}." ".$_ if($.!=0);END{foreach (sort keys %a){print $a{$_}}}' temp
11 aa ww
22 bb kk
13 cc ll
>