0

我尝试在 perl 驱动程序脚本中使用一些 unix 工具,因为我对编写 shell 脚本知之甚少。我的目的是将几个简单的 unix 命令组合在一起,这样我就可以在一个 perl 命令中在 100 个目录上运行脚本。

任务是我有100多个文件夹,每个文件夹中有n个文件。我想对每个文件夹做同样的事情,就是将其中的文件合并起来,对合并后的文件进行排序,然后使用bedtools合并重叠区域(生物信息学中很常见的做法)

这是我所拥有的:

#!/usr/bin/perl -w
use strict;

my $usage ="
This is a driver script to merge files in each folder into one combined file
";
die $usage unless @ARGV;

my ($in)=@ARGV;
open (IN,$in)|| die "cannot open $in";

my %hash;
my $final;

while(<IN>){
    chomp;
    my $tf = $_;
    my @array =`ls $tf'/.'`;
    my $tmp;
    my $tmp2;
    foreach my $i (@array){
        $tmp = `cut -f 1-3 $tf'/'$i`;
        $tmp2 = `cat $tmp`;
    }
    my $tmp3;
    $tmp3=`sort -k1,1 -k2,2n $tmp2`;
    $final = `bedtools merge -i $tmp3`;
}
print $final,"\n";

我知道这条线根本不起作用..

$tmp2 = `cat $tmp`;

问题是如何将输出定向到 perl 中的另一个变量并稍后在另一个 unix 命令中使用该变量...

如果您能指出我可以更改以使其工作的地方,请告诉我。非常感激。

4

3 回答 3

1

反引号的输出通常包括换行符,通常必须在使用下游输出之前将其删除。在您的代码中添加一些chomp's:

chomp( my @array =`ls $tf'/.'` );

my $tmp;
my $tmp2;
foreach my $i (@array){
    chomp( $tmp = `cut -f 1-3 $tf'/'$i` );
    chomp( $tmp2 = `cat $tmp` );
}
my $tmp3;
chomp( $tmp3=`sort -k1,1 -k2,2n $tmp2` );
$final = `bedtools merge -i $tmp3`;
于 2013-10-28T21:07:47.780 回答
0

好的。我放弃了 perl 并决定尝试使用 shell 脚本。有效!!不过还是感谢上面的回答!

for dir in `ls -d */`
do
    name=$(basename $dir /)
    cd $dir
    for file in `ls`
    do
        cut -f 1-3 $file > $file.tmp
    done
    for x in `ls *tmp`
    do
        cat $x >> $name.tmp1
    done
    sort -k1,1 -k2,2n $name.tmp1 > $name.tmp2
    bedtools merge -i $name.tmp2 > $name.combined
done
于 2013-10-28T21:33:41.230 回答
0

要在 shell 中使用 perl 变量,这是一个示例:

#!/usr/bin/env perl

my $var = "/etc/passwd";

my $out = qx(file $var);

print "$out\n";

其余的,它非常混乱。您应该花时间学习 perl,而不是将 coreutils 命令和 Perl 混为一谈,因为 perl 本身是一个更好的工具来解决这个问题。

于 2013-10-28T21:05:01.580 回答