0

我的代码是:

    matches = re.search('(<meta.*?>)', contents, re.DOTALL)
    if matches:
        for group in matches.groups():
            metas.append(group)
    title = re.search('(<title>.*?</title>)', contents, re.DOTALL)
    if title.groups():
        found_title = title.group(1) + '\n'
    else:
        found_title = ''

它正在处理具有元和标题标签(小写)的 HTML 页面,因此我希望元标签和非空标题有多个匹配项。在正则表达式周围添加或删除括号似乎没有什么区别。

4

1 回答 1

2

re.search搜索第一个匹配项。您需要使用re.findallre.finditer

于 2012-11-24T00:50:37.247 回答