linux - Linux 在同一个 CSV 文件中将一列拆分为两个不同的列

Question

嗨，我有一个包含以下条目的 csv 文件

11
22
13
,,
aa
bb
cc
,,
ww
kk
ll
,,

请向我建议一个 linux 命令或脚本，它可以将此 colomun 拆分为同一文件中的 3 列，如下所示

11  aa  ww
22  bb  kk
13  cc  ll

score 2 · Accepted Answer

你可以用awk.

创建一个名为的文件script.awk，其内容如下：

BEGIN {
   line = 0; #Initialize at zero
}
/,,/ { #every time we hit the delimiter
   line = 0; #reset line to zero 
}
!/,,/{ #otherwise
   a[line] = a[line]" "$0; # Add the new input line to the output line
   line++; # increase the counter by one 
}
END {
   for (i in a )
      print a[i] # print the output
}

像这样运行文件：

awk -f test.awk < datafile

输出：

$ cat datafile
11
22
13
,,
aa
bb
cc
,,
ww
kk
ll
,,
$ awk -f script.awk < datafile 
 11 aa ww
 22 bb kk
 13 cc ll

或者，如果您只想要一个单线，请执行以下操作：

awk 'BEGIN{line=0;}/,,/{line=0;}!/,,/{a[line++]=a[line]" "$0;}END{for (i in a ) print a[i]}' datafile

编辑：

这将在字段之间添加逗号：

awk 'BEGIN{line=0;}/,,/{line=0;}!/,,/{a[line++]=a[line]?a[line]","$0:$0;}END{for (i in a ) print a[i]}' datafile
                                                              # ^ This is the part that I changed

score 1 · Accepted Answer

这是一个很好的疯狂的 shell 管道，它实际上做了 OP 想要的：！

#% cat t
11
22
13
,,
aa
bb
cc
,,
ww
kk
ll
,,

然后

#% pr -t -3 -l 4 -s' ' t | sed '$d'
11 aa ww
22 bb kk
13 cc ll

我敢肯定有更好的命令而不诉诸代码。

编辑感谢@user000001 提醒我的错误，让我重新审视我的解决方案。

score 0 · Accepted Answer

0

这可能对您有用：

pr -tT3 -s\  file | sed \$d

于 2013-02-05T21:02:16.473 回答

score 0 · Accepted Answer

用 awk

awk 'BEGIN {RS=",,\n"; FS="[\n]"}{ }{a=a$1" ";b=b$2" ";c=c$3" ";} END{print a"\n"b"\n"c}' temp.txt

输出

11 aa ww
22 bb kk
13 cc ll

score 0 · Accepted Answer

perl -lne 'if(/,,/){$.=0}$a{$.}=$a{$.}." ".$_ if($.!=0);END{foreach (sort keys %a){print $a{$_}}}'

测试如下：

> cat temp
11
22
13
,,
aa
bb
cc
,,
ww
kk
ll
,,
> perl -lne 'if(/,,/){$.=0}$a{$.}=$a{$.}." ".$_ if($.!=0);END{foreach (sort keys %a){print $a{$_}}}' temp
 11 aa ww
 22 bb kk
 13 cc ll
>

linux - Linux 在同一个 CSV 文件中将一列拆分为两个不同的列

5 回答 5

Related

Reference