我使用 lxml 在 Python 中编写了一个小型 html 解析器。它非常有用,但我有一个问题。
我有以下代码:
tags = doc.xpath('//table//tr/td[@align="right"]/b')
for tag in tags:
print(x.text.strip())
它工作正常。但是如果元素<br>内部有标签<b>,像这样:
<b> first-half <br>
second-half </b>
此代码只会打印first-half到<b>标签中。
<b>即使有<br>标签,如何获取所有文本?
谢谢。