我需要提取网站的详细内容,同时保留该部门的所有格式。我要提取的部分是:
...
<div class="detailContent"><p>
<P dir=ltr><STRONG>Hinweis</strong>: Auf ... </p>
</div>
...
我当前的解决方案是使用来自 libxml2 和 xpath 的 HTMLParser 来查找节点并遍历所有节点以重建这段 HTML。这是一个很长很复杂的代码。
我只是想知道是否有更简单的解决方案来提取部分 HTML?
谢谢。