假设我将一个完整的 HTML 表(当每个tr
和td
具有额外属性时)复制到一个字符串中。如何获取所有内容(标签之间的内容)并创建一个像原始表格一样组织的二维数组?
例如对于这个表:
<table border="1">
<tr align= "center">
<td align="char">TD1</td>
<td>td1</td>
<td align="char">TD1</td>
<td>td1</td>
</tr>
<tr>
<td>TD2</td>
<td>tD2</td>
<td class="bold>Td2</td>
<td>td2</td>
</tr>
</table>
我想要这个数组:
PS:我知道我可以使用正则表达式,但这会非常复杂。我想要一个像 JSoup 这样的工具,它可以自动完成所有工作,而无需编写太多代码