1

我有一个目录,里面有两种文件类型:*.sai 和 *fastq,我想在一个 shell for 循环中使用这两个变量:

for j in *sai *fastq

 do bwa samse $j $j > ${j%.sai}.sam 

done;

在命令之后,do我想将相应的 *.sai 和 *.fastq 数据加载到程序中(bwa samse)。你能帮我语法吗?

例子:

在一个目录中xx.fast xx.sai yy.fastq yy.sai,程序 bwa samse 需要一次处理两个相应的文件 -bwa samse xx.fastq xx.sai...

非常感谢您的任何想法。

4

4 回答 4

1

尽量不要用来ls喂循环。使用大括号扩展仅在循环中包含*.sai和文件:*.fastq

for j in ./*.{sai,fastq}
do
    ## do what you need to the *.sai & *.fastq files 
done

您还可以提供路径变量:

mypath=/path/to/files
for j in "${mypath}"/*.{sai,fastq}
(snip)

注意:不知道做什么bwa samse $j $j > ${j%\.*}.sam。解释您需要如何处理文件,我可以提供进一步的帮助..

如果存在一对一的关系(匹配 .sai 和 .fastq 文件),则只需:

for j in ./*.sai
do
    fname="${j%.*}"   # remove the extension ($fname is filename w/o ext)
    ## do what you need to the *.sai & *.fastq files 
    #  bwa samse "${fname}.sai" "${fname}.fastq" whatever else
done
于 2014-12-10T22:22:41.970 回答
1

尝试使用 bash参数扩展来执行此操作:

for j in .*sai; do  
    [[ -s ${j%.sai}.fastq ]] &&
        bwa samse "$j" "${j%.sai}.fastq" > "${j%.sai}.sam"     
done

并且请停止使用解析ls输出杀死小猫。(不适合你不可救药)

于 2014-12-10T22:23:25.793 回答
1

使用 GNU Parallel 它看起来像这样:

parallel bwa samse ref.fasta {} {.}.fastq '>' {.}.sam  ::: *.sai   

GNU Parallel 是一个通用的并行器,可以轻松地在同一台机器上或在您可以通过 ssh 访问的多台机器上并行运行作业。它通常可以替换for循环。

如果您想在 4 个 CPU 上运行 32 个不同的作业,那么并行化的直接方法是在每个 CPU 上运行 8 个作业:

简单的调度

GNU Parallel 会在完成后生成一个新进程 - 保持 CPU 处于活动状态,从而节省时间:

GNU 并行调度

安装

如果没有为您的发行版打包 GNU Parallel,您可以进行个人安装,这不需要 root 访问权限。这样做可以在 10 秒内完成:

(wget -O - pi.dk/3 || curl pi.dk/3/ || fetch -o - http://pi.dk/3) | bash

有关其他安装选项,请参阅http://git.savannah.gnu.org/cgit/parallel.git/tree/README

学到更多

查看更多示例:http ://www.gnu.org/software/parallel/man.html

观看介绍视频:https ://www.youtube.com/playlist?list=PL284C9FF2488BC6D1

浏览教程:http ://www.gnu.org/software/parallel/parallel_tutorial.html

注册电子邮件列表以获得支持:https ://lists.gnu.org/mailman/listinfo/parallel

于 2015-06-19T18:41:33.740 回答
0

(编辑以反映评论 -ls没有必要使用列出文件名)

要删除您需要使用的文件扩展名${j%\.*},它将保留最后一个字符之前的所有字符.

for j in *.sai *.fastq
do
    bwa samse $j $j > ${j%\.*}.sam 
done;
于 2014-12-10T22:15:56.550 回答