0

这是一个抓取前两列中包含 $position 和 $amino 值的行的程序。

代码:

#!/usr/bin/perl

my $id = $ARGV[0];
my $position = $ARGV[1]; # POSITION OF THE RESIDUE
my $amino= $ARGV[2]; #THREE LETTER AMINO ACID CODE IN CAPITALS
my @grabbed;

open (FILE, $id.$amino.$position.".hb2");

#CREATES AN ARRAY WITH ONLY THE VALUES FROM THE HB2 FILE. REMOVES THE HEADER OF THE FILE.

while (<FILE>) {
    if (/^-/) {
            push @grabbed, $_;
            while (<FILE>) {
            last if /^$/;
            push @grabbed, $_;
            }

    }
}
close (FILE);


for ( @grabbed ) {
my @f = split;
if (( $f[2] == "-"."00".$position."-".$amino ) or ($f[0] == "-"."00".$position."-".$amino)) {
    push @line, $id.$amino.$position, " ",$_;
}
}
print @line;

部分输入数据:

-0007-ARG NH2 -0009-GLN OE1 3.24 SS   2  6.00 143.3  2.38 105.9  95.8     1 #CASE 1
-0008-GLU N   -0008-GLU OE1 2.62 MS   0 -1.00 120.8  1.96 102.3 103.4     2
-0011-ILE N   -0117-ARG O   2.87 MM 106  4.90 144.0  2.00 127.5 139.0     3 
-0117-ARG N   -0011-ILE O   2.75 MM 106  4.90 160.4  1.79 153.2 148.6     4 #CASE 2
-0016-SER N   -0012-THR O   2.89 MM   4  6.00 156.2  1.95 149.8 154.8     5 #CASE 3
-0017-ALA N   -0013-LEU O   3.10 MM   4  6.24 152.8  2.17 143.4 149.7     6
-0018-GLU N   -0014-ARG O   3.04 MM   4  6.24 154.1  2.11 147.2 154.2     7
-0019-ILE N   -0015-GLY O   2.90 MM   4  6.16 155.8  1.96 150.7 156.2     8
-0016-SER OG  -0188-THR OG1 2.72 SS 172  5.92 172.0  1.73  98.9  99.6     9
-0188-THR OG1 -0016-SER OG  2.72 SS 172  5.92 163.7  1.75 116.4 115.1    10

问题 :

为了概括程序,我将匹配设置为:

( $f[2] == "-"."00".$position."-".$amino ) or ($f[0] == "-"."00".$position."-".$amino)

格式总是在 $amino (-0188-THR) 之前的“-”之后的四位数字。我突然意识到如果 $position 输入是“一位数(如 CASE 1)”或“三位数(如 CASE 2,第 1 列)”,我的代码将不起作用。由于我将其硬编码为“-”格式,后跟两个零和 THEN 位置,因此它必须始终是两位数输入才能工作。

我很难概括这段代码,以便我可以输入 1/2/3 位数字。其余数字将始终被零替换。

4

2 回答 2

1

You can format the string using sprintf:

  my $mstring = sprintf("-%04d-%s", $position, $amino);
  if ( ($f[2] eq $mstring) or ($f[0] eq $mstring) ) {
    # ...
  }

Here, %04d adds 0's to the left of position to make it 4 digits long.

于 2012-08-15T15:32:47.597 回答
0

首先,==perl 中的运算符仅用于比较算术表达式 要比较字符串,您应该使用eq运算符
其次,要从数字格式化字符串,您可以使用 sprintf 函数。

if ($f[2] eq "-".sprintf("%04d", $position)."-".$amino ...
于 2012-08-15T15:35:08.667 回答