我使用 beautifulsoup 来提取数据。
我有这样一个 html 文件:
<div class=a>
<a href='google.com'>a</a>
</div>
<div class=b>
<a href='google.com'>c</a>
<a href='google.com'>d</a>
</div>
我想提取数据'c,d',我不需要数据'a'
所以我这样做:
google_list = soup.findAll('a',href='google.com')
for item in google_list:
print item.strings
它将打印 a、c、d。所以我的问题是如何在没有 'a' 的情况下打印 'c','d' in