2
from bs4 import BeautifulSoup
soup = BeautifulSoup( '''<SELECT>
<option value="1">ONE</option>
<option value="2" selected>TWO</option>
<option value="3">THREE</option>
<option value="4">FOUR</option>
<option value="5">FIVE</option>
</SELECT>''' )

print( soup.findAll('option', selected=True) )

输出是:

[]

我试图在上面的示例中获取所选选项的字符串。但是如果“选择”没有分配给任何东西,我就无法获得正确的选项,它不必设置为 True。

from bs4 import BeautifulSoup

soup = BeautifulSoup( '''<SELECT>
<option value="1">ONE</option>
<option value="2" selected=''>TWO</option>
<option value="3">THREE</option>
<option value="4">FOUR</option>
<option value="5">FIVE</option>
</SELECT>''' )

print( soup.findAll('option', selected=True) )

输出是:

[<option selected="" value="2">TWO</option>]

由于我只阅读一个 html 文件,因此我无法控制该部分。有办法解决吗?我正在使用 BeahutifulSoup 4.1.3 和 python 3.3.0

4

0 回答 0