我有一个 HTML 文件,我想使用 Jsoup 读取并将结果导出到 Excel 工作表。在这个过程中,我想提取 HTML 文件中存在的所有图像的链接(src)。
这是我用来做同样事情的代码片段:
File myhtml = new File("D:\\Projects\\Java\\report.html");
//get the string from the file myhtml
String str = getFileString(myhtml);
//getting the links to the images as in the html file
Document doc = Jsoup.parseBodyFragment(str);
Elements media = doc.select("[src]");
//System.out.println(media.size());
for(Element imageLink:media)
{
if(imageLink.tagName().equals("img"))
//storing the local link to image as global variable in imlink
P1.imlink = imageLink.attr("src").toString();
System.out.println(P1.imlink);
}
}
我想要链接的 HTML 文件中有两个图像。但是,我编写的代码仅显示文件中存在的第一个图像的链接。请帮我找出我的代码中的错误!