我有一个这样的 HTML:
<html>
<body>
<table>
<tr>
Text before Text1
<td>Text1</td>
Text after Text1
</tr>
<tr>
Text before Text2
<td>Text2</td>
Text after Text2
</tr>
</table>
</body>
</html>
我正在使用 lxml 和 Python。我想使用 XPath 来查找Text after Text1
和Text after Text2
我尝试了 XPath/html/body/table/tr
并获取了相对路径的文本./td
,但我只能获取Text before Text1
and Text before Text2
。
那么我该如何实现呢?
一个例子:
<tr>
<td width="16"><img alt="" src="http://source.qunar.com/site/images/airlines/small/HU.gif"></td>
<td valign="top">海航<span class="dc">HU7605</span><br>首都T1-虹桥/td>
</tr>
我能找到海航
但找不到首都T1-虹桥
。