我正在寻找一个基于 Java 的 html 解析器,它可以搜索和替换保留 html 标签的文本。这个问题以前在这里被问过,但答案似乎没有达到目标。我下载并编写了一些简单的程序来查看它们是否可以完成这项工作的 html 解析器很少。这些包括 jsoup、Jericho、Java HTML 解析器等。这些可以进行搜索,但是在替换保留 html 标记的文本时,没有办法做到这一点。
我已经阅读了这些帖子的完整主题:
如何在保留html标签/结构的同时查找/替换html中的文本
如果今天不存在这样的解析器,那么实现它的最佳方法是什么?如果您已经做过类似的事情,您可以分享代码吗?