我在这里有多段代码,并且在将它们放在一起时遇到问题,因此我的函数将实际运行。
我有一个功能:
def getGenes(spliced, infile, outfile):
它有一个可选的第一个参数“-s”,当用户输入时,它表示一个“开关”,需要“拼接基因序列”。因此,我跟着它(另外,运行时。sys.agrv[1] = spliced sys.argv[2] = infile 和 sys.argv[3] = outfile):
import sys
spliced = False
if '-s' in sys.argv:
spliced = True
infile, outfile = sys.argv[2:]
现在,无论文件是否包含我想将以下内容从 infile 写入 outfile 的开关:
fp = open(infile, 'r')
for line in fp:
line = line.replace(',',' ')
tokens = line.split()
if '-s' in sys.argv and r:
wp.write('>'+tokens[0]+'|'+tokens[1]+'('+tokens[2]+')'+':'+int(tokens[3])+'-'+int(tokens[4])+'|'+int(tokens[5])+'-'+int(tokens[10])+','+int(tokens[8])+'-'+int(tokens[11]))
else:
wp.write('>'+tokens[0]+'|'+tokens[1]+'('+tokens[2]+')'+':'+int(tokens[3])+'-'+int(tokens[4]))
第一个语句应该在给定拼接参数时编写,第二个(其他部分)应该在没有给出拼接参数时编写)。上面的代码为输出文件下一行的序列创建信息行。
在此之后,根据文件中的一行在特定位置是否包含“+”或“-”,访问另一个文件以在特定坐标处提取字符串。取出来的这部分应该直接写在上面对应的行下面。所以,我应该为拼接和未拼接的参数都有一个“+”和“-”部分。我有以下代码:
fp2 = open('chr22.fa', 'r')
for line in fp2:
newstring = ''
z = line.strip()
newstring += z
for line in fp:
fields = line.split('\t')
gene_ID, chr, strand = fields[:2]
start = int(fields[3])
end = int(fields[4])
bc = {'A': 'T', 'C': 'G', 'G': 'C', 'T': 'A', 'N':'N'}
if strand == '+':
wp.write(newstring[start:end])
if strand == '-':
newstart, newend = -(start + 1), -(end + 1)
wp.write(bc[base.upper()] for base in newstring[newstart:newend])
如您所见,我让它根据是否存在“+”或“-”从文件中选择不同的部分。也就是说,我需要将它用于拼接和未拼接选项。但是从该文件中提取的每一行(或字符串)都应与其相应的信息行(在最后一段代码中创建)一起放置。这里的代码是从另一个文件中提取一个序列并翻译它。
我需要以某种方式将这两段代码放在一起,以便我的输出文件的格式具有:
一条信息
对应序列
另一条信息线
对应序列