我有两个 Genbank 文件,我正在提取执行以下操作的基因:
genes_1 = []
for feature in sequence.features:
if feature.type=='gene':
genes_1.append(feature)
这工作得很好,我能够获得我需要的基因的序列、GC 含量和翻译。
第二个 Genbank 文件是一种非常相似的细菌菌株。我的想法是使用新提取的序列:
dnaA = hits[0]
extracted_sequence_1 = dnaA.extract(sequence_tuberculosis)
要搜索第二个 Genbank 文件:
for extracted_sequence_1 in genes_2:
for gene in genes_2.extract(sequence_2):
if extracted_sequence_1 in genes_2.extract(sequences_2):
print('Match')
但是,很明显,我收到了一个错误:
AttributeError: 'list' object has no attribute 'extract'
我一直试图在 bioPython 指令上找到这些信息,但没有什么与我需要的相似。有没有办法在不运行对齐的情况下做到这一点?