更新:(事情更复杂,包括blocks,我从一开始就没有解释,但我知道这应该适用于正则表达式或其他东西)
如何将 HTML 块解析为每个非空标签的表格布局?例如,这个 HTML:
<p class="block1">
<span class="styleclass2">
<span class="styleclass25">
<strong>
<u></u>Some Text Here
</strong>
<br>
</span>
</span>
<span class="styleclass5">
<u>
<a href="http://www.example.com">www.example.com</a>
</u>
</span>
<br>
<span class="styleclass24">Some Text Here</span>
</p>
<p class="block2">
<span class="styleclass2">
<span class="styleclass25">
<strong>
<u></u>Some Text Here2
</strong>
<br>
</span>
</span>
<span class="styleclass5">
<u>
<a href="http://www.example2.com">www.example2.com</a>
</u>
</span>
<br>
<span class="styleclass24">Some Text Here2</span>
</p>
并制作这些:
<table>
<tr>
<td>Some Text Here</td>
<td>www.example.com</td>
<td>Some Text Here</td>
</tr>
<tr>
<td>Some Text Here2</td>
<td>www.example2.com</td>
<td>Some Text Here2</td>
</tr>
</table>
主要思想是如何对这些块进行分组,以便为找到的每个块排成一行……