biopython - 在两个 gb 文件中搜索匹配的序列

翻译自：https://stackoverflow.com/questions/68057244 2021-06-20T15:14:20.250

22 次

我有两个 Genbank 文件，我正在提取执行以下操作的基因：

genes_1 = []
for feature in sequence.features:
    if feature.type=='gene':
        genes_1.append(feature)

这工作得很好，我能够获得我需要的基因的序列、GC 含量和翻译。

第二个 Genbank 文件是一种非常相似的细菌菌株。我的想法是使用新提取的序列：

dnaA = hits[0]
extracted_sequence_1 = dnaA.extract(sequence_tuberculosis)

要搜索第二个 Genbank 文件：

for extracted_sequence_1 in genes_2:
    for gene in genes_2.extract(sequence_2):
        if extracted_sequence_1 in genes_2.extract(sequences_2):
            print('Match')

但是，很明显，我收到了一个错误：

AttributeError: 'list' object has no attribute 'extract'

我一直试图在 bioPython 指令上找到这些信息，但没有什么与我需要的相似。有没有办法在不运行对齐的情况下做到这一点？

biopython - 在两个 gb 文件中搜索匹配的序列

0 回答 0

Related

Reference