这就是我想做的。我有一个基因名称列表,例如:[ITGB1, RELA, NFKBIA]
在 biopython 和 entrez API 教程中查找帮助我想出了这个:
x = ['ITGB1', 'RELA', 'NFKBIA']
for item in x:
handle = Entrez.efetch(db="nucleotide", id=item ,rettype="gb")
record = handle.read()
out_handle = open('genes/'+item+'.xml', 'w') #to create a file with gene name
out_handle.write(record)
out_handle.close
但这不断出错。我发现如果 id 是一个数字 id(尽管你必须将它变成一个字符串才能使用,'186972394' 所以:
handle = Entrez.efetch(db="nucleotide", id='186972394' ,rettype="gb")
这让我得到了我想要的信息,其中包括序列。
所以现在问题: 我如何搜索基因名称(因为我没有 id 编号)或轻松地将我的基因名称转换为 id 以获得我拥有的基因列表的序列。
谢谢,