1

我正在编写一个程序,该程序可以访问网页,查找并下载所有图像和常见文档(.docx .pdf 等),然后访问页面上的每个链接并执行相同操作。我遇到的问题是,当我深入解析链接时,jsoup 出现 400 个错误: Exception in thread "main" org.jsoup.HttpStatusException: HTTP error fetching URL. Status=400, URL=http://www.somerandomurl.com

代码:

Document doc = Jsoup.connect(urlstring).userAgent("Chrome").get();

帮助?

4

2 回答 2

0

您如何解析链接(请提供更多代码)?通常有必要使用绝对链接而不是简单属性。

于 2012-10-08T08:29:46.013 回答
0

这可能是您的网址中可能存在的重音或特殊字符的问题。

于 2014-02-14T09:44:17.000 回答