我想在特定行标识符(行列上的属性)之后获取所有表行,直到找到该特定行标识符。
这是我要解析的html:
<tr>
<td colspan="4">
<h3>Header 1</h3>
</td>
</tr>
<tr>
<td>Item desc - Header 1</td>
<td>more info</td>
<td>30</td>
<td>500</td>
</tr>
<tr>
<td colspan="4">
<h3>Header 2</h3>
</td>
</tr>
<tr>
<td>Item desc - header 2</td>
<td>other</td>
<td>4</td>
<td>49</td>
</tr>
<tr>
<td>Item 2 desc - header 2</td>
<td>other 2</td>
<td>65</td>
<td>87</td>
</tr>
我希望能够抓取标题 1 下的项目并在找到标题 2 时停止;然后是标题 2 下的项目,并在找到标题 3 时停止;等等
这可能在xpath下吗?在找到具有特定属性(colspan =“4”)的子节点之前,我无法让它只找到 TR 节点。