我有蛋白质,我想找到它们对应的核苷酸序列。我也有发现蛋白质的基因组。在基因组中,我找到了该蛋白质的相应基因 ID。但是,我在获取带有 Gene ID 的核苷酸序列时遇到了麻烦。我曾尝试使用 Entrez Efetch:
Entrez.email = "dddd@gmail.com"
with open("genome.gb", "w") as out_handle:
request = Entrez.efetch(db="gene", id="2703488", rettype="gb", retmode="text")
out_handle.write(request.read())
request.close()
但这仅返回以下内容:
1. G
tail component [Escherichia virus Lambda]
Other Aliases: lambdap14
Other Designations: tail component
Annotation: NC_001416.1 (9711..10133)
ID: 2703488
反正有没有使用 Efetch 获得实际的核苷酸序列?提前致谢!