0

我有两组文件。一个文件给出了基因名称列表(每行一个基因)。第二个文件有一个基因对列表(例如,=> '1,2' 和一个基因对 perl 行)。基因名称是数字的。我想列出除已知基因对之外的所有可能的基因组合。

我的输出应该是:

3,4  
4,5  
6,7  
...  
...  

但是,我得到这样的东西=>

,4  
,5  
,7  

所有第一个元素都不会打印。我不确定代码到底有什么问题。任何人都可以帮忙吗?

我的代码:

#! usr/bin/perl

use strict;
use warnings;

if (@ARGV !=2) {
   die "Usage: generate_random_pairs.pl <entrez_genes> <known_interactions>\n";
}
my ($e_file, $k_file) = @ARGV;

open (IN, $e_file) or die "Error!! Cannot open $e_file\n";
open (IN2, $k_file) or die "Error!! Cannot open $k_file\n";

my @e_file = <IN>; chomp (@e_file);
my @k_file = <IN2>; chomp (@k_file);

my (%known_interactions, %random_interactions);

foreach my $line (@k_file) {
    my @array = split (/,/, $line);
    $known_interactions{$array[0]} = $array[1];
}

for (my $i = 0; $i <= $#e_file; $i++) {
    for (my $j = $i+1 ; $j <= $#e_file; $j++) {
        if ((exists $known_interactions{$e_file[$i]}) && ($known_interactions{$e_file[$i]} == $e_file[$j])) {next;}
        if ((exists $known_interactions{$e_file[$j]}) && ($known_interactions{$e_file[$j]} == $e_file[$i])) {next;}
        print "$e_file[$i],$e_file[$j]\n";
    }
}
4

1 回答 1

3

您的文件使用 CR LF 作为行尾,但您在使用 LF 作为行尾的系统上,因此您的程序输出

"3" <CR> "," "4" <CR> <LF>

您的终端显示为

,4

使用修复行尾

dos2unix inputfile

或者改变

chomp(@e_file);
chomp(@k_file);

s/\s+\z// for @e_file;
s/\s+\z// for @k_file;
于 2012-07-31T03:15:56.663 回答