我有一个包含特定标签的 HTML 文件,例如<TABLE cellspacing=0>
,结束标签是</TABLE>
. 现在我想获取这些标签之间的所有内容。我在 Java 中使用 Jericho HTML 解析器来解析 HTML。是否可以在 Jericho 解析器中的特定标签之间获取文本和其他标签?
例如:
<TABLE cellspacing=0>
<tr><td>HELLO</td>
<td>How are you</td></tr>
</TABLE>
回答:
<tr><td>HELLO</td>
<td>How are you</td></tr>