任何人都可以帮助我阅读标签内的页面源代码。
我已经尝试过使用 htmlUnit 和 jsoup ......但它只返回里面的内容和标签。任何回应都将受到高度赞赏。
任何人都可以帮助我阅读标签内的页面源代码。
我已经尝试过使用 htmlUnit 和 jsoup ......但它只返回里面的内容和标签。任何回应都将受到高度赞赏。
用于element.html()
读取 HTML 而不是JSoup中标签本身的包含
例如:
String html = "<p>An </p><form action="SOMESERVLET"><b>example</b></form> ";
Document doc = Jsoup.parse(html);
String htmlContent = doc.select("form").first().html();
对于您的情况
Document doc = Jsoup.connect("example.com").get();
Iterator<Element> itr = doc.select("form").iterator()
while(itr.hasNext()){
Element element = itr.next();
System.out.println(element.html());
}
一步步
<form>
它的标签start index
</form>
它的标签last index
,*如果这个标签不存在,最后一个索引是长度* substring
从索引start
end
这是简单的算法,但我认为有很多工具可以帮助你!!!