我想获得 BLAST 结果的前 10 个序列(只是序列,没有比对或分数或 e 值等)。我正在输入一个包含 5 个 fasta 文件的文本文件。所以我的输出应该是每个 fasta 文件的前 10 个爆炸命中。因此我的输出文件将有 50 个序列。
我正在通过 Bio.SeqIO 读取每个输入的 fasta 文件,将其写入 temp.faa,然后通过子进程将其传递给命令行 BLAST
blastp -db nr -query temp.faa -out out.faa -evalue 0.001 -gapopen 11 -gapextend 1 -matrix BLOSUM62 -remote -outfmt 2
输出有很多其他信息。我现在应该解析这个输出还是有更好的方法。
谢谢
PS XML 可能是一种方法,但我没有找到相关的 NCBIXML 解析器语法。