0

我正在尝试获取所有链接aclass=fl我正在使用 mechanize 获取原始 html 输出,然后使用 beautifulsoup 尝试解析链接。

的值rawGatheredGoogleOutput是输出类似的输出(这只是一个谷歌结果):红色部分是向您展示我想要抓取的内容,即a.fl

4

1 回答 1

1

要查找a具有class=fl属性的元素,您可以find_all这样调用:

getAdditionalGooglePages = beautifulSoupObj.find_all('a', attrs={"class": "fl"})

对于其他属性,它更简单 - 例如,id=fl它将是:

getAdditionalGooglePages = beautifulSoupObj.find_all('a', id="fl")

...但这不适用于class,因为它是 Python 保留字。

于 2013-08-14T23:45:22.613 回答