这是我写的脚本。
两个问题。
首先,我们需要打印形成 XML hit_id、hit_len 和 hit_def 的爆炸结果。前两个很容易。但是 hit.def 和 def 是一样的。如何避免?
其次,我们需要在linux上运行程序。这个程序应该接受两个序列,一个是蛋白质,一个是核酸,通过使用可选参数。但我就是无法实现这个功能。
它应该在什么时候工作
$ python my_program.py protein.fa tem.txt prot
最后一个是参数选项。我不明白为什么 python 在我写的时候不接受它
f=sys.argv[3]
f1=str(sys.argv[3])
if f1 is 'prot':
function(filename,protflag=True)
Python 总是选择“其他”
# IMPORT
import sys
import subprocess
################################################################################
# FUNCTIONS
#execute BLAST, vailable type are protein and nuclien
def run_blast(filename,protflag=True):
"""execute BLAST, vailable type are prot or na"""
if protflag:
subprocess.call(['blastp','-query','filename','-db','nr','-outfmt','5','-out','prot.xml'])
else :
subprocess.call(['blastn','-query','filename','-db','nt','-outfmt','5','-out','na.xml'])
def read_XML(filename):
"""return hit_id length hit_def"""
from Bio.Blast import NCBIXML
name=str(filename)
record=NCBIXML.read(open(name))
for i in range(0,len(record.alignments)):
hit=record.alignments[i]
print 'hit_id'+hit.id+'\n'+'length'+hit.len+'\n'+'hit_def'+hit.def+'\n'#here is the problem .def
################################################################################
# MAIN
# write a function for the "main method"
def main(filename=sys.argv[1],protflag=True):
"""excuate BLAST with file then return the hit_id, length and hit_def"""
f=sys.argv[3]
f1=str(f)
if f is 'prot':
run_blast(filename,True)
read_XML("prot.xml")
elif f is 'na':
run_blast(filename,False)
read_XML("prot.xml")
else:
print 'only prot and na available'
if __name__ == '__main__':
# defaults to reading the system, see above :)
main()