1

我在这里有多段代码,并且在将它们放在一起时遇到问题,因此我的函数将实际运行。

我有一个功能:

def getGenes(spliced, infile, outfile):

它有一个可选的第一个参数“-s”,当用户输入时,它表示一个“开关”,需要“拼接基因序列”。因此,我跟着它(另外,运行时。sys.agrv[1] = spliced sys.argv[2] = infile 和 sys.argv[3] = outfile):

import sys
spliced = False
if '-s' in sys.argv:
    spliced = True
    infile, outfile = sys.argv[2:]

现在,无论文件是否包含我想将以下内容从 infile 写入 outfile 的开关:

fp = open(infile, 'r')
for line in fp:
    line = line.replace(',',' ')
    tokens = line.split()
    if '-s' in sys.argv and r:
        wp.write('>'+tokens[0]+'|'+tokens[1]+'('+tokens[2]+')'+':'+int(tokens[3])+'-'+int(tokens[4])+'|'+int(tokens[5])+'-'+int(tokens[10])+','+int(tokens[8])+'-'+int(tokens[11]))
    else:
        wp.write('>'+tokens[0]+'|'+tokens[1]+'('+tokens[2]+')'+':'+int(tokens[3])+'-'+int(tokens[4]))

第一个语句应该在给定拼接参数时编写,第二个(其他部分)应该在没有给出拼接参数时编写)。上面的代码为输出文件下一行的序列创建信息行。

在此之后,根据文件中的一行在特定位置是否包含“+”或“-”,访问另一个文件以在特定坐标处提取字符串。取出来的这部分应该直接写在上面对应的行下面。所以,我应该为拼接和未拼接的参数都有一个“+”和“-”部分。我有以下代码:

fp2 = open('chr22.fa', 'r')
for line in fp2:
    newstring = ''
    z = line.strip()
    newstring += z
for line in fp:
    fields = line.split('\t')
    gene_ID, chr, strand = fields[:2]
    start = int(fields[3])
    end = int(fields[4])
    bc = {'A': 'T', 'C': 'G', 'G': 'C', 'T': 'A', 'N':'N'}       
    if strand == '+':
        wp.write(newstring[start:end]) 
    if strand == '-':
        newstart, newend = -(start + 1), -(end + 1)
        wp.write(bc[base.upper()] for base in newstring[newstart:newend]) 

如您所见,我让它根据是否存在“+”或“-”从文件中选择不同的部分。也就是说,我需要将它用于拼接和未拼接选项。但是从该文件中提取的每一行(或字符串)都应与其相应的信息行(在最后一段代码中创建)一起放置。这里的代码是从另一个文件中提取一个序列并翻译它。

我需要以某种方式将这两段代码放在一起,以便我的输出文件的格式具有:

一条信息

对应序列

另一条信息线

对应序列

4

1 回答 1

1

你不能只做一个,然后另一个,像这样:

for line in fp:
  # Info line
  line = line.replace(',',' ')
  tokens = line.split()
  if '-s' in sys.argv and r:
    wp.write('>'+tokens[0]+'|'+tokens[1]+'('+tokens[2]+')'+':'+int(tokens[3])+'-'+int(tokens[4])+'|'+int(tokens[5])+'-'+int(tokens[10])+','+int(tokens[8])+'-'+int(tokens[11]))
  else:
    wp.write('>'+tokens[0]+'|'+tokens[1]+'('+tokens[2]+')'+':'+int(tokens[3])+'-'+int(tokens[4]))

  # Sequence line
  fields = line.split('\t')
  gene_ID, chr, strand = fields[:2]
  start = int(fields[3])
  end = int(fields[4])
  bc = {'A': 'T', 'C': 'G', 'G': 'C', 'T': 'A', 'N':'N'}       
  if strand == '+':
    wp.write(newstring[start:end]) 
  if strand == '-':
    newstart, newend = -(start + 1), -(end + 1)
    wp.write(bc[base.upper()] for base in newstring[newstart:newend])

或者我在这里错过了什么?

于 2012-04-26T13:53:47.317 回答