4

我的虚拟文件如下所示:

  >Tom
  text
  text text, year = 16 
  text 
  text
  text
  Grades . . . . 10
  Grades . . . . 9
  >Ann  
  text
  text text, year = 17 
  text 
  Grades . . . . 10
  Grades . . . . 10
  Grades . . . . 9 

我想:
为每个名称赋值,在成绩行中提取年份和最后一个数字。
对于这样的输出:

  1 Tom 
  1 year = 16
  1 10
  1 9 
  2 Ann
  2 year = 17
  2 10
  2 10
  2 9 

我不知道如何在下一条记录之前修改记录中的文本。有可能grep '^>' -An,但每条记录的行号都不同。

4

2 回答 2

4

假设您的真实文件中没有前导空格,这是使用的一种方法awk

awk 'sub(/^>/,"") { print ++i, $0 } /Grades/ { print i, $NF } /year =/ { print i, "year = ", $NF }' file

结果:

1 Tom
1 year =  16
1 10
1 9
2 Ann  
2 year =  17
2 10
2 10
2 9
于 2013-06-04T13:40:12.460 回答
2
perl -nE 'BEGIN{ $/ = ">"; $i=0} chomp; next unless length; $i++; say "$i $_" for /(.+)/, /(year\s*=.+)/, /grades.+?(\d+)/gi' file
于 2013-06-04T13:50:11.013 回答