这是一个提取 4.5 埃内的相邻残基的程序。我已经将程序解析为原子数。从这些我想提取
- 残数,
- 残留名称,
- 原子№和
- 原子名称。
我想以表格形式输出这些数据,以便我可以直接复制结果。但是现在我被困住了,需要帮助来提取我在其中获得的原子序数的那些字段$close_atomno
,以及如何一次性使用该程序来处理多个 pdb 文件和不同的催化残基。
任何帮助表示赞赏。
#!/usr/bin/perl
use List::Util qw(sum);
use Data::Dumper qw(Dumper);
use 5.010;
say "enter residue no.";
chomp(my $r_no = <STDIN>);
my (@all_pos, @all_data, @matching_pos, @matching_data);
my $residue_file = "neighbouring_residues.txt";
open my $out_fh1, '>', $residue_file or die "Can't open $residue_file: $!";
say "enter file name";
chomp(my $infile_name = <STDIN>);
open IN, '<', $infile_name or die "Can't open $infile_name: $!";
LINE: while (<IN>) {
chomp;
/^ATOM/ or next LINE;
my @fields = split;
push @all_pos, [ @fields[6 .. 8] ];
push @all_data, [ @fields[1 .. 3, 5] ];
if( $fields[6] eq $r_no) {
say $_;
push @matching_pos, [ @fields[6 .. 8] ];
push @matching_data, [ @fields[1 .. 3, 5] ];
}
}
say $out_fh1 "Neighbouring residues at position $r_no in the 4.5A region are:";
my %close_atoms;
MATCHING_ATOM:
for my $i1 ( 0 .. $#matching_pos ) {
my $matching_atom = $matching_data[$i1][1];
$matching_atom eq $_ and next MATCHING_ATOM for qw/N CA O C/;
for my $i2 ( 0 .. $#all_pos ) {
my ($close_atomno, $close_residueno) = @{$all_data[$i2]}[0, 3];
my $dist = distance($matching_pos[$i1], $all_pos[$i2]);
if($dist < 4.5 and $close_residueno != $r_no) {
$close_atoms{$close_atomno} = 1;
}
}
}
sub distance { sqrt sum map {$_**2} map {$_[0][$_] - $_[1][$_]} 0 .. $#{$_[0]} };
my @close_atoms = keys %close_atoms;
say $out_fh1 "@close_atoms";
for my $m (0 .. $#close_atoms) {
say $out_fh1 $all_pos[$m];# here is problem i want residue details according to $close_atomno
}
say "result in $residue_file";
这将是一个典型的输入文件:
ATOM 9 N GLU A 1 35.540 1.925 27.662 1.00 19.70 N
ATOM 10 CA GLU A 1 35.626 1.018 28.802 1.00 20.96 C
ATOM 11 C GLU A 1 34.264 0.794 29.444 1.00 20.22 C
列按此顺序:
- 原子
- 原子序数
- 原子名
- 残基名称
- 链
- 残数
- x坐标
- y坐标
- z坐标
- 无关紧要的
- 无关紧要的
- 无关紧要的