我有一个 html 文件说:
<html>...
<li id="123"></li>
<li id="3455"></li>
....
</html>
如何使用 BeautifulSoup 在 python 中获取所有 id 的值?所需的输出是:["123","3455"]
我有一个 html 文件说:
<html>...
<li id="123"></li>
<li id="3455"></li>
....
</html>
如何使用 BeautifulSoup 在 python 中获取所有 id 的值?所需的输出是:["123","3455"]
要获得您想要的列表,请使用列表推导。它可以在一行中完成,如下所示(最后一行):
html = '<html> <li id="123"></li><li id="3455"></li> </html>'
soup = BeautifulSoup(html)
attrs = [li['id'] for li in soup.find_all('li')]
from BeautifulSoup import BeautifulSoup
foo = '<html> <li id="123"> </li> <li id="3455"></li> </html>'
soup = BeautifulSoup(foo)
for id in soup.html.findAll('li'):
print id['id']