我正在尝试解析一个 html 文件,并且我想提取具有唯一 ID 的外部 div 标记内的所有内容。样本:
<body>
...
<div id="1">
<div id="2">
...
</div>
<div id="3">
...
</div>
</div>
...
</body>
在这里,我想提取介于两者之间的所有内容<div id="1">
及其对应</tag>
的 NOT 第一个</div>
标签。
我浏览了许多较旧的帖子,但它们不起作用,因为当他们看到</div>
不是我想要的第一个标签时,它们就停止了。
任何指针将不胜感激。