我对生物信息学比较陌生,但我会尽力学习。我遇到了一个问题,我希望有人知道该怎么做,并向我解释用于多个文件的 bash 工具实际上是如何工作的。
我有一个包含 160 个 RNAseq 库的文件夹,解压后看起来像name.fastq
. 我想同时cutadapt
在所有这些上运行(一个将从我的库中删除所有适配器序列的软件);因此,对于一个库,命令如下所示:
python2.6 /imports/home/w/workshop/oibc2013/oibc1/Apps/cutadapt-1.2.1/bin/cutadapt -a name_adapter input_file.fastq > out
所以我尝试制作一个 bash 数组循环,以便能够对我拥有的所有 160 个文件执行此操作,但它仍然无法正常工作。
!/bin/bash
. $HOME/.bashrc
my_array=(*.fastq)
echo ${myarray["SGE_TASK_ID"-1]}
python2.6 \
/imports/home/w/workshop/oibc2013/oibc1/Apps/cutadapt-1.2.1/bin/cutadapt \
-a CTGTCTCTTATACACATCT \
-b AATTGCAGTGGTATCAACGCAGAGCGGCCGC \
-b GCGGCCGCTCTGCGTTGATACCACTGCAATT \
-b AAGCAGTGGTATCAACGCAGAGTACATGGG \
-b CCCATGTACTCTGCGTTGATACCACTGCTT \
inputs.$SGE_TASK_ID \
results.$SGE_TASK_ID]}