是否可以仅获取特定的 URL?
像:
<a href="http://www.iwashere.com/washere.html">next</a>
<span class="class">...</span>
<a href="http://www.heelo.com/hello.html">next</a>
<span class="class">...</span>
<a href="http://www.iwashere.com/wasnot.html">next</a>
<span class="class">...</span>
输出应该只是来自的 URLhttp://www.iwashere.com/
比如,输出 URL:
http://www.iwashere.com/washere.html
http://www.iwashere.com/wasnot.html
我是通过字符串逻辑做到的。有没有使用 BeautifulSoup 的直接方法?