有谁知道如何使用 Biopython 或 BioJAVA 从 FTP ncbi 自动搜索和解析 gbk 文件。我在 Biojava 中搜索了实用程序,但没有找到任何实用程序。我也尝试过 BioPython,这是我的代码:
from Bio import Entrez
Entrez.email = "test@yahoo.com"
Entrez.tool = "MyLocalScript"
handle = Entrez.esearch(db="nucleotide", term="Mycobacterium avium[Orgn]")
record = Entrez.read(handle)
print record
print record["Count"]
id_L = record["IdList"]
print id_L
print len(id_L)
但是,只有 3 种鸟分枝杆菌(全基因组序列和完全注释),我得到的结果是 59897。
谁能告诉我如何在 BioJava 或 BioPython 中执行搜索。否则我将不得不从头开始自动化这个过程。
谢谢你。