我正在尝试从网站上抓取以下 href。网站上有几个我打算抓取的href,因此我正在循环浏览该网站,以便将它们全部存储在一个列表中。以下是其中一个 href 的示例。
<div class="col-md-4 h-gutter">
<div class="product box" data-productid="2111214">
<a href="/products/examples/product1/">
<h3>Product 1</h3>
<div class="product-small-text">
这是我有问题的代码部分。注释掉的是我试图只收集hrefs。由于这不起作用,现在我正试图刮掉整个“col-md-4 h-gutter”
for product in soup.select('div.product.box'):
link.append(product)
#link.append(product.a['href'])
print(link)
下面是打印到终端的内容。如您所见,href 隐藏在占位符后面。
</div>, <div class="product placeholder-container box">
<h3><span class="placeholder-text--long"></span></h3>
<div class="product-small-text">
<span class="placeholder-text--short"></span>
</div>
如何打印出 href 的值?