我正在尝试使用 re.compile 来匹配网页上的值
我的网页包含以下 HTML:
<div id="paginate">
<strong>1</strong>
<a href="http://www.link2.com/">2</a>
<a href="http://www.link3.com/">3</a>
<a href="http://www.link2.com">></a>
<a href="http://www.link20.com/">Last ›</a>
</div>
我的正则表达式如下:
re.compile('<a href="(.+?)">></a>').findall()
这返回
['http://www.link2.com/">2</a>
<a href="http://www.link3.com">3</a>
<a href="http://www.link2.com/']
我只想获取包含大于符号作为标签的链接的href?
有任何想法吗?
提前致谢