0

我正在使用 trnL 叶绿体基因从食草动物粪便中识别植物,目前正在尝试将分类学分配给来自我的 Illumina 输出的 trnL 序列。这是我想运行的 QIIME 脚本和选项:

assign_taxonomy.py -i rep_set_numbered.fa -r sequence.fasta -t id_to_taxonomy.txt -e 0.01 -m blast

我有来自我们数据管道的输入文件,以及来自 NCBI GenBank(205,703 个序列)的参考文件。但是,我没有制表符分隔的分类文本文件。通常我会从 Excel 生成一个,但由于 FASTA 文件太大(超过 500 MB),它无法在 Excel 中完全查看,因此无法可靠地编辑。

我的问题是,有没有一种命令行方法可以从我的参考 FASTA 文件中生成我自己的制表符分隔的分类文件,如果有,我该怎么做?如果没有,在“assign_taxonomy.py”QIIME 脚本中处理此必需选项的其他选项是什么?

4

0 回答 0