我的代码是:
matches = re.search('(<meta.*?>)', contents, re.DOTALL)
if matches:
for group in matches.groups():
metas.append(group)
title = re.search('(<title>.*?</title>)', contents, re.DOTALL)
if title.groups():
found_title = title.group(1) + '\n'
else:
found_title = ''
它正在处理具有元和标题标签(小写)的 HTML 页面,因此我希望元标签和非空标题有多个匹配项。在正则表达式周围添加或删除括号似乎没有什么区别。