我目前正在尝试解决编程问题。我试图在任何 HTML 页面中查找重复的结构,并试图检索这些元素的值。
例如,我有一个带有重复元素的 HTML 页面,如下所示:
<html>
<body>
<ul>
<li>green</li>
<li>orange</li>
<li>red</li>
</ul>
</body>
在这段代码中,我想检测是否存在重复块(“li”项),并且我想提取它们的值。另一个 HTML 示例:
<table>
<tr>
<td>1</td>
<td>John</td>
</tr>
<tr>
<td>2</td>
<td>Simon</td>
</tr>
</table>
在此示例中,我想检测结构是否重复,并从中获取值 [1,John] 和 [2,Simon]。
我的问题是:是否有一个简单的算法来做这样的事情,或者,如果没有,你将如何处理这样的事情?