源代码
HTML = "<title>RUU</title>"
reExtraTitle = re.compile("<title[^>]*>([^<]*)</title>", re.IGNORECASE)
mcTitle = reExtraTitle.match(HTML)
if mcTitle:
print mcTitle.group()
else:
print "no Title"
正则表达式帮助我
欢迎来到 StackOverflow。今天人们对反对票很严厉,对此我很抱歉。我猜你的母语不是英语,对吗?
您的问题符合SSCCE原则,尽管它表明您对研究有点轻率,并且您实际上并没有提出正确的问题,尽管很明显您在追求什么。您的答案在于您应该阅读的re module doc 。
你需要import re
先,然后改变
print mcTitle.group()
至
print mcTitle.group(1)
正如其他人所暗示的那样,您也许应该考虑使用专用的 html 解析器而不是使用 regexp。