我设法只打印了 h2 和 h3 标签。但我想要从第一个 h2 到第二个 h2 标签的每个元素(这些标签中的数据仅与英语有关)。就像在这张图片中然后,我想检查名词,动词等类别的数据,如果它们存在 - 将它们打印出来。在这里被卡住了。这是我到目前为止写的
url = 'https://en.wiktionary.org/wiki/dog'
r = requests.get(url,headers={'User-agent': 'Mozilla/5.0 (Windows NT 6.2; WOW64)'})
data = r.text
soup = BeautifulSoup(data)
content = soup.find_all('span',{'class':'mw-headline'})
for item in content:
print item.text