我想用JsoupDOCTYPE
解析页面以发现 HTML 的版本( HTML 5、HTML 4、XHTML等)。
是否可以DOCTYPE
用Jsoup解析来处理它?如果不是,有一种方法可以实现发现页面 HTML 版本的主要目标?
Jsoup
有DocumentType
这个目的的类:
List<Node>nods = doc.childNodes();
for (Node node : nods) {
if (node instanceof DocumentType) {
DocumentType documentType = (DocumentType)node;
System.out.println(documentType.toString());
System.out.println(DocumentType.attr("publicid"));
}
}