-1

我运行了一个分子动力学模拟,它给了我 2,000 个轨迹文件。这些文件的文件名格式au25-c2-benzalacetone.001最多为 2000。我编写了一个通用的 perl 程序,但它没有读取 2,000 个文件。如何修改我的代码,使其读取每个文件并分别提取我想要的每个文件的坐标?我需要 2,000 个coordinates_of_interest.dat文件。这里的修补程序文件是au25-c2-benzalacetone文件。这是我写的代码:

#!/usr/bin/env perl
use Math::VectorReal;
use Math::Trig qw/acos/;
use strict;
use warnings;


   my $file1 = $ARGV[0];
   my $n1 = $ARGV[1];
   my $n2 = $ARGV[2];
   my $tinker_file = sprintf "%s.%03d"

   my( $file1, $n1, $n2 ) = @ARGV; 

  foreach $tinker_file (glob "$tinker_file.*") {
     print "Filename: $tinker_file\n";
  }

   my $file2 = "coordinates_of_interest.dat";
   my %lines_of_interest = map { $_ => 1 } 18, 25, 26;


{
open(FILE2, '>', $file2) or die "couldn't open the file!";

for(my $i=$n1;$i<=$n2;$i++){
{
open(FILE1, '<', $tinker_file) or die "couldn't open the file!";
{

my $num_lines = keys %lines_of_interest;

while (<FILE1>) {
   if ($lines_of_interest{$.}) {
      print FILE2;
      last unless --$num_lines;
              }
            }
         }
       }
    }
 }                                                                                                                                     

~
~
~

4

3 回答 3

0

如果文件格式是au25-c2-benzalacetone.001,您的第一个问题似乎是$i可能不是三位数。你可能想要类似的东西my $tinker_file = sprintf "%s.%03d", $file1, $i;

我注意到的另一个问题是你一直打开“coordinates_of_interest.dat”进行写入,而不是追加,所以只有最后一个文件会有三行。我建议如果您要为所有输入写入单个文件,请在循环之外(之前)打开该文件for,并在循环完成后关闭它。

于 2016-08-23T15:03:47.977 回答
0

这些文件的文件名格式为 au25-c2-benzalacetone.001 到 2000。

my $tinker_file = sprintf "%s.%03d"

除了这条线不完整之外,您无法将 1 到 2000 的数字放入三位数字段中。这可能是您的脚本没有读取所有文件的原因。

于 2016-08-23T16:47:18.993 回答
-1

glob您的朋友在这里使用通配符并搜索目录:

my ( $filespec, $n1, $n2 ) = @ARGV; 

foreach my $file ( glob "$filespec.*" ) { 
   print "Filename: $file\n";
}

或者您可以使用glob扩展模式:

my $expr = join ",", 0..9;

foreach my $entry ( glob ( "test.{$expr}{$expr}{$expr}" ) ) {
   print $entry,"\n";
}

但我可能会坚持第一个,因为这将确保文件确实存在。

于 2016-08-23T15:04:40.703 回答