0

第二个嵌套 if 语句不识别声明的名称。我已经在第二个 if 语句之后注释掉了代码,但是我需要它。文件中有很多行。那些有 CDS 字符串的我需要一个符号,row[6]而那些有特征字符串的我需要一切,但我也需要知道这个符号。CDS 和特征行中的 ID 应该匹配,因此 test if t.group(2) == n.group(2)。我尝试了 continue 语句,但它仍然无法正常工作。谢谢大家的帮助

Traceback (most recent call last):
  File "../scripts/gff_cds.py", line 22, in <module>
    print sign
NameError: name 'sign' is not defined

import sys, csv, re

gff_ref = open(sys.argv[1])
parse_ref = csv.reader(gff_ref, delimiter='\t')

writer = csv.writer(sys.stdout)

ref_list = [] 

for row in parse_ref:
    if len(row) > 1 and 'remark' not in row and 'CDS' in row:
        t = re.search('(Transcript):(\w+.\w+\.?[0-9]?)', row[8])
        temp = t.group(2)
        sign = row[6]
    #    continue
    if 'feature' in row:
        print sign, temp
    #    ref_dict = {}
    #    n = re.search('(\W\w+):(\w+.\w+\.?[0-9]?)', row[8])
    #    if temp == n.group(2):
    #        ref_dict['seqname'] = row[0]; ref_dict['start'] = int(row[3]);
    #        ref_dict['end'] = int(row[4]); ref_dict['strand'] = sign;
    #        ref_dict['id'] = t.group(2)
    #        
    #        ref_list.append(ref_dict)

例如

CHROMOSOME_I 特征 inferred_pa​​rent 13349410 13358674 。. . ID=成绩单:Y40B1A.3c

CHROMOSOME_I Coding_transcript CDS 13349410 13349478。+ 0 ID=CDS:Y40B1A.3c;父母=成绩单:Y40B1A.3c;状态=部分确认;wormpep=CE:CE45409

CHROMOSOME_I Coding_transcript CDS 13353007 13353245。+ 0 ID=CDS:Y40B1A.3c;父母=成绩单:Y40B1A.3c;状态=部分确认;wormpep=CE:CE45409

CHROMOSOME_I Coding_transcript CDS 13354069 13354225。+ 0 ID=CDS:Y40B1A.3c;父母=成绩单:Y40B1A.3c;状态=部分确认;wormpep=CE:CE45409

4

1 回答 1

2

sign仅当len(row) > 1 and 'remark' not in row and 'CDS' in row检查给出真实结果时才分配。如果它为假,则sign永远不会收到值,但无论如何你都会尝试使用它。

我不明白你想用这段代码做什么,所以我无法确定正确的修复,但首先要做的是检查你的缩进级别。确保应该在if块中的东西在块中,并且不应该在块中的东西是未缩进的。

于 2013-09-18T23:16:57.737 回答