0

我在 FASTA 中有 1000 多个蛋白质序列及其登录号。我想回到全基因组鸟枪法数据库并检索所有编码与我的初始序列列表中的一个相同的蛋白质的 DNA 序列。

我试过运行一个 tBlastn,每个序列的结果 <10,每个查询 1 个,e 值低于 1e-100 或 e 值为零,但我没有得到任何结果。我想自动化整个过程。

这可以通过从命令行和批处理脚本运行 blast 来完成吗?

4

2 回答 2

0

您可能会发现此链接很有用:

https://www.biostars.org/p/5403/

那里已经提出了类似的问题,并且已经发布了一些合理的解决方案。

于 2014-12-09T21:35:15.390 回答
0

您应该至少得到一个结果:编码原始蛋白质的结果。如果我跟着你,其他的,如果有的话,将是假基因。

无论如何,一些编程可能会有所帮助,请查看Biopython。Bioperl 或 Bioruby 应该具有类似的功能。特别是您可以使用 Biopython 进行 BLAST

于 2014-12-08T09:37:45.990 回答