我试图找到一个包含 http 或 // 或 \ 的链接,并在找到后用 href 标记包围,但是当从 xml 读取的数据中逐行读取时。我看到输出与每个字母分开。请请参阅下面的输入和输出..有人可以建议我哪里出错了吗?
INput:-http://pastebin.com/p9H8GQt4
Currentoutput:- http://pastebin.com/7428jK63
sanity_results = sanity_results.replace('\n','<br>\n')
return sanity_results
def main ():
resultslis=[]
xmlfile = open('results.xml','r')
contents = xmlfile.read()
testresults=getsanityresults(contents)
#print testresults
for line in testresults:
#print line
line = line.strip()
#print line
line = re.sub(r'(http://[^\s]+|//[^\s]+|\\\\[^\s]+)', r'<a href="\1">\1</a>', line)
print line
resultslis.append(line)
print resultslis
if __name__ == '__main__':
main()