0

我想做的是在基因组文件中以小写形式制作 GenBank 记录的所有非推定序列。

到目前为止,我设法获得了 gbk 中蛋白质的开始和结束位置。从那里我执行以下操作:

start = feature.location.nofuzzy_start
end = feature.location.nofuzzy_end
gb_record.seq[start:end]

现在我有了基因组中序列的开始和结束位置。但是如何修改基因组文件呢?gb_record.seq[start:end].lower()或类似的东西没有成功。

当我分配时,当gb_record.seq = gb_record.seq[start:end].lower我替换基因组文件时,它显然出错了。有任何想法吗?

4

1 回答 1

1

Bio.Seq.Seq对象有一种lower()方法可以满足您的需求。

处理你的代码,你会得到:

seq_lower = gb_record.seq.lower()

然后,您应该能够使用该SeqIO模块将小写序列写入文件。

from Bio import SeqIO

with open("example.fasta", 'w') as handle:
    SeqIO.write(lower_records, handle, 'fasta')
于 2012-04-01T22:08:39.677 回答