如何使用 BeautifulSoup 查找页面中指向特定域的所有链接?
问问题
2436 次
1 回答
8
使用 SoupStrainer,
from BeautifulSoup import BeautifulSoup, SoupStrainer
import re
# Find all links
links = SoupStrainer('a')
[tag for tag in BeautifulSoup(doc, parseOnlyThese=links)]
linkstodomain = SoupStrainer('a', href=re.compile('example.com/'))
编辑:来自官方文档的修改示例。
于 2010-01-28T00:23:30.237 回答