我有一个表格,想从一些数据单元格中提取数据。
<table>
<tr>
<td class="label"> </td>
<td class="data"><p><a href="http://en.wikipedia.org/wiki/Liu_Kang"><img src="http://upload.wikimedia.org/wikipedia/en/e/e2/LiuKangshaolinmonks.jpg"/></a></p>
</td>
</tr>
<tr>
<td class="label">First game</td>
<td class="data">Mortal Kombat (1992)</td>
</tr>
<tr>
<td class="label">Created by</td>
<td class="data">John Tobias</td>
</tr>
<tr>
<td class="label">Orgin</td>
<td class="data">Earthrealm</td>
</tr>
<tr>
<td class="label">Weapon</td>
<td class="data">Nunchaku</td>
</tr>
<tr>
<td class="label">Colour</td>
<td class="data">Red</td>
</tr>
</table>
我想提取Nunchaku
,这有效:
/html/body//tr[5]/td[@class="data"]
但我宁愿跳过tr[5]
而是使用td[contains(., 'Weapon')]
,但我不确定如何。