0

是否可以输出 CDS 特征的基因位置,还是我需要自己解析“位置”或“补充”字段?

例如,

seq = Sequence.read(genbank_fp, format='genbank')
for feature in seq.metadata['FEATURES']:
    if feature['type_'] == 'CDS':
        if 'location' in feature:
            print 'location = ', feature['location']
        elif 'complement' in feature:
            print 'location = ', feature['complement']
        else:
            raise ValueError('positions for gene %s not found' % feature['protein_id'])

会输出:

位置 = <1..206

位置 = 687..3158

对于这个样本 GenBank 文件。

这个功能在 BioPython(见这个线程)中是可能的,我可以输出已经解析的位置(例如 start = 687,end = 3158)。

谢谢!

4

1 回答 1

1

例如,您可以Sequence使用以下代码仅获取该功能的对象:

# column index in positional metadata
col = feature['index_']
loc = seq.positional_metadata[col]
feature_seq = seq[loc]
# if the feature is on reverse strand
if feature['rc_']:
    feature_seq = feature_seq.reverse_complement()

注意:GenBank 解析器是在开发分支中新增的。

于 2015-09-23T15:41:10.857 回答