尝试从 html 文件打印提取的信息,变量“ac”存储提取的内容(核苷酸 ID,例如:224589800),但函数退出而不打印变量。
import re
import urllib2
def sr():
a = raw_input('Enter Gene Id:')
b = int(a)
s = urllib2.urlopen('http://www.ncbi.nlm.nih.gov/gene/?term=s','r')
h = s.read()
s.close()
acc = re.search('gi=(.+?)&',h) #Extraction of Nucleotide Id from html file
if acc:
ac = acc.group(1)
print ac