0

我一直在尝试使用 JTidy 抓取一些在线内容,但我遇到了这个烦人的错误,我不知道如何修复它或让 JTidy 忽略它:

InputStream: Doctype given is "-//W3C//DTD XHTML 1.0 Transitional//EN"
InputStream: Document content looks like XHTML 1.0 Transitional
630 warnings, 1 error were found!
This document has errors that must be fixed before
using HTML Tidy to generate a tidied up version.

这似乎是一个愚蠢的错误 - 并且没有其他错误,所以这似乎是阻止 JTidy 解析文档的错误。我直接从 HttpURLConnection 的 InputStream 解析它,并且我使用 Tidy.parseDom 方法。

4

0 回答 0