我见过类似的问题,但我见过的解决方案不适用于以下问题。我远非 XPath 专家。我只需要解析一些 HTML。如何选择 Header 2 后面的表格。我认为下面的解决方案应该可以工作,但显然不行。有谁可以帮我离开这里吗?
content = """<div>
<p><b>Header 1</b></p>
<p><b>Header 2</b><br></p>
<table>
<tr>
<td>Something</td>
</tr>
</table>
</div>
"""
from lxml import etree
tree = etree.HTML(content)
tree.xpath("//table/following::p/b[text()='Header 2']")