我使用 lxml 在 Python 中编写了一个小型 html 解析器。它非常有用,但我有一个问题。
我有以下代码:
tags = doc.xpath('//table//tr/td[@align="right"]/b')
for tag in tags:
print(x.text.strip())
它工作正常。但是如果元素<br>
内部有标签<b>
,像这样:
<b> first-half <br>
second-half </b>
此代码只会打印first-half
到<b>
标签中。
<b>
即使有<br>
标签,如何获取所有文本?
谢谢。