1

我有很宽的文件,其中包含制表符分隔的列:

Donna   25.07.83   Type1   A   B   C   D  E   F   G   H  ....
Adam    17.05.78   Type2   A   B   C   D  E   F   G   H  ....

我想打印出所有内容,但是在第三列之后每两列打印一个标签..

Donna   25.07.83   Type1   AB   CD  EF   GH  ....
Adam    17.05.78   Type2   AB   CD  EF   GH  ....

我认为可能有比这更聪明的方法

awk '{OFS="\t"} {print $1, $2, $3, $4$5, $6$7, $8$9}' 

等等,特别是因为我的文件中有超过 1000 列。awk 可以这样做吗?

4

2 回答 2

1
awk '{for(i=1;i<=NF;i++){if(i>=4){$i=$i$(i+1);$(i+1)="";i+=1}}print}' your_file

测试:

> cat temp
Donna   25.07.83   Type1   A   B   C   D  E   F   G   H
Adam    17.05.78   Type2   A   B   C   D  E   F   G   H
> awk '{for(i=1;i<=NF;i++){if(i>=4){$i=$i$(i+1);$(i+1)="";i+=1}}print}' temp
Donna 25.07.83 Type1 AB  CD  EF  GH 
Adam 17.05.78 Type2 AB  CD  EF  GH 
于 2013-03-04T09:10:50.133 回答
1

很恶心,但有效:

awk '{printf "%s\t%s\t%s",$1,$2,$3; for(i=4;i<=NF;i+=2) printf "\t%s%s",$i,$(i+1); print ""}' wide.txt

NF是一个awk变量,它的值是一个数字,告诉您当前行有多少列。你会在手册中找到它。

让我们把它拆开:

#!/usr/bin/awk -f

{ 
  printf "%s\t%s\t\%", $1, $2, $3;  # print the first 3 columns, explicitly 
                                    # separated by TAB. No NEWLINE will be printed.

  # We want to print the remaining columns in pairs of $4$5, $6$7

  for( i = 4; i <= NF ; i+=2 )       # i is 4, then 6, then 8 ... till NF (the num. of the final column)
     printf "\t%s%s", $i, $(i+1);   # print \t$4$5, then \t$6$7, then \t$8$9 

  print ""                          # We haven't print the end-of-line NEWLINE
                                    # yet, so this empty print should do it.
}
于 2013-03-04T09:02:54.197 回答