0

我正在尝试解析一个看起来像这样的 html 表单:

<select name="country">
<option value="1">Afghanistan</option>
<option value="2">Albania</option>
<option value="3">Algeria</option>
<option value="4">Andorra</option>
....
</select>

使用 lxml.html.parse 解析文档后,我可以使用以下方法访问值列表:

doc.forms[0].elements["country"].value_options

但是,这将返回一个原始值列表(['1', '2', '3', '4' ...]),没有相应的国家名称。有没有一种简单的方法来获取选项标签的内容,包括文本和值?

4

1 回答 1

1

我使用 xpath 来通过 html... 尝试:

options = doc.xpath("//select[@name='country']/option")
option_text = [option.text for option in options]
于 2012-08-20T10:50:27.977 回答