我正在尝试使用以下内容获取所有链接 innerHTML
import re
s = '<div><a href="page1.html" title="page1">Go to 1</a>, <a href="page2.html" title="page2">Go to page 2</a><a href="page3.html" title="page3">Go to page 3</a>, <a href="page4.html" title="page4">Go to page 4</a></div>'
match = re.findall(r'<a.*>(.*)</a>', s)
for string in match:
print(string)
但我只得到最后一次出现,“转到第 4 页”我认为它看到了一个大字符串和几个匹配的正则表达式,它们被视为重叠并被忽略。那么,我如何获得匹配的集合
['转到第 1 页'、'转到第 2 页'、'转到第 3 页'、'转到第 4 页']