4

我在解析网站时收到此错误。错误:“实体“ContentType”的声明必须以“>”结尾。' 或输入类型必须关闭

4

1 回答 1

2

你考虑过JTidy吗?

JTidy 是 HTML Tidy 的 Java 端口,是一个 HTML 语法检查器和漂亮的打印机。像它的非 Java 表亲一样,JTidy 可以用作清理格式错误和有缺陷的 HTML 的工具。此外,JTidy 还为现实世界的 HTML 提供了一个 DOM 解析器。

显然,在某些时候它会根据 HTML 格式的糟糕程度而与 HTML 发生冲突,但您可能会发现这对您有用。

于 2013-03-08T10:19:17.203 回答