您好我正在使用 JSoup 解析 HTML 文件。解析后,我想检查文件是否包含标签。我正在使用以下代码来检查,
htmlDom = parser.parse("<p>My First Heading</p><a href=\"www.google.com\">clk</a>");
Elements pe = htmlDom.select("html");
System.out.println("size "+pe.size());
即使不存在 HTML 标记,我得到的输出也是“大小 1”。我的猜测是,这是因为 HTML 标签不是强制性的,而且它是隐式的。Head 和 Body 标签也是如此。有什么方法可以检查输入文件中是否存在这些标签?
谢谢你。