我正在尝试使用 biopython 向 genbank 文件添加超过 70000 个新功能。
我有这个代码:
from Bio import SeqIO
from Bio.SeqFeature import SeqFeature, FeatureLocation
fi = "myoriginal.gbk"
fo = "mynewfile.gbk"
for result in results:
start = 0
end = 0
result = result.split("\t")
start = int(result[0])
end = int(result[1])
for record in SeqIO.parse(original, "gb"):
record.features.append(SeqFeature(FeatureLocation(start, end), type = "misc_feat"))
SeqIO.write(record, fo, "gb")
结果只是一个列表,其中包含我需要添加到原始 gbk 文件中的每个功能的开始和结束。
这个解决方案对我的电脑来说非常昂贵,我不知道如何提高性能。有什么好主意吗?