0

我试图分析不同的网站以找到它包含的所有图像。

现在,我使用带有以下代码的 Jsoup:

      Elements imagePath = doc.select("[src]");
      e.attr("abs:src")

现在,当我在域名上运行它时,我会得到很多图像,但是如果我尝试在子域上运行相同的东西,我会得到相同的图像

例如,网站http://www.example.com会预测与http://www.example.com/page1相同的输出

现在我的问题是 JSoup 是否找到了域的所有子站点的所有图像,或者它是否只是随机的运气,它会产生相同的输出?

4

1 回答 1

1

你在更新你的Document对象吗?我的猜测是(因为没有提供有价值的代码)您已经将您的域解析为doc并且您没有对子域执行相同的操作。Jsoup 仅将您的选择应用于当前文档节点,与子域/页面等无关(因为它甚至不必是网站)。

于 2013-08-06T08:01:37.803 回答