我需要清理我的 Java 项目中的 Html5 页面。
所以我需要一个 Java 库,或者一个在 Linux 和 Windows 上都可以运行的命令行程序。
JTidy 不能很好地工作(我测试过)。HTML5 的 HTML Tidy 是一个 C++ 库,它的命令行版本仅适用于 Linux。
你知道 Validator.nu HTML Parser 是否也清理了(我没有找到任何关于它的信息)?
你有什么想法吗?
谢谢
使用JSoup。得到很好的支持,没有本地组件(应该在 Java 运行的任何地方运行),免费但非常自由的许可证。另外,支持 HTML5