2

我想从 DSSP 文件中提取 helix(H) 残基。

1CRN.dssp

 31   37 A K  H   < S+
 32   38 A V  H  < S+ 
 33   39 A F  H >< S- 
 34   40 A G  G >< S+ 
 35   41 A K  G >  S+ 

1GB5.dssp

113  242 B G  H 3>>S+
114  243 B I  H <45S+    
115  244 B L  H X45S+     
116  245 B S  H 3<5S+ 
117  246 B K  T >X5S+   

我想以以下格式保存输出。

>1CRN
KVF
>1GB5
GILS

我怎样才能用 awk 做到这一点?您的建议将不胜感激!

4

1 回答 1

5

是第 5 列中的“H”表示“螺旋(H)残基”吗?

awk '{
  if (FNR == 1 ) print ">" FILENAME  
  if ($5 == "H") {
    printf $4
  }
} 
END { printf "\n"}'  file

输出

>tstDat.txt
KVF

IHTH

于 2012-08-25T13:40:27.230 回答