使用 JSoup 包括最后一个版本 1.7.2 存在一个错误,解析带有未闭合标签的无效HTML 。
例子:
String tmp = "<a href='www.google.com'>Link<p>Error link</a>";
Jsoup.parse(tmp);
生成的文档是:
<html>
<head></head>
<body>
<a href="www.google.com">Link</a>
<p><a>Error link</a></p>
</body>
</html>
浏览器会生成如下内容:
<html>
<head></head>
<body>
<a href="www.google.com">Link</a>
<p><a href="www.google.com">Error link</a></p>
</body>
</html>
Jsoup 应该用作浏览器或源代码。
有什么解决办法吗?查看API我没有找到任何东西。