0

我正在尝试从 HTML 页面信息中进行选择。我使用 python 和 HTMLParse 库。

我想获得价值,它包含在下一个 html 元素中:

<span class = 'relevant' >Some relevant information <span class = 'param isquery' >Another information </span> etc.</span>

即信息保存在标签“span”之间,但具有特定的属性类='相关'。

我面临的主要问题-如何检索具有特定属性的“跨度”部分之间的信息?据我了解,方法 handle_endtag() 只有标签(没有任何属性)。

所以,如果我有嵌套标签,我不能使用这种方法吗?

PS我看到了问题如何使用python HTMLParser库从特定的div标签中提取数据?,但这个问题不包括具有特定属性的嵌套标签。

4

0 回答 0