0

我有一个 html 文件说:

<html>...  
  <li id="123"></li>
  <li id="3455"></li>
  ....
</html>

如何使用 BeautifulSoup 在 python 中获取所有 id 的值?所需的输出是:["123","3455"]

4

2 回答 2

2

要获得您想要的列表,请使用列表推导。它可以在一行中完成,如下所示(最后一行):

html = '<html> <li id="123"></li><li id="3455"></li> </html>'
soup = BeautifulSoup(html)

attrs = [li['id'] for li in soup.find_all('li')]
于 2012-07-13T23:26:53.267 回答
0
from BeautifulSoup import BeautifulSoup

foo = '<html> <li id="123"> </li> <li id="3455"></li> </html>'

soup = BeautifulSoup(foo)

for id in soup.html.findAll('li'):
    print id['id']
于 2012-07-13T23:21:43.977 回答