我想用fastacmd
来提取 fasta 序列的特定区域。为此,我需要输入 fasta 文件-d
的名称、序列的名称-s
和要提取的序列的位置-L
。例如:
fastacmd -d OAP11402.1.fa -s OAP11402.1 -L 50,100
但问题是我有数百个文件(每个文件都有一个与文件同名的序列),并且要提取的每个序列的位置信息都在蛋白质数据库中(info_sequences.txt
)。所以,我想做一个循环来粘贴文件的名称,序列和从蛋白质数据库info_sequences.txt
中 提取的位置fastacmd
。
的样子info_sequences.txt
是这样的:
File seq_id position_start position_end
OAP11402.1.fa OAP11402.1 50 100
OAP15774.1.fa OAP15774.1 75 200
OAP10214.1.fa OAP10214.1 33 310
我认为这awk
可能会有所帮助,但我正在努力将信息粘贴到fastcmd