0

我有以下代码:

String website = "http://www.somewebsite.com/";

Document doc = Jsoup.connect(website).get();

Elements aElements = doc.select("a");

for (Element element : aElements)
{
    System.out.println(element.attr("href"));
}

当我看到 href 内容的输出时,它如下所示:

当我使用浏览器 (Firefox) 访问网页时,href 内容如下所示:

.../../../picture1.jpg
.../../../picture2.jpg .../../../
picture3.jpg .../../../
picture4 .jpg

我尝试使用以下代码将“Referer”变量更改为网站名称:

Document doc = Jsoup.connect(website).header("Referer", "http://www.somewebsite.com/").get();

但这不起作用..

网站如何以某种方式“隐藏”我的 Jsoup“下载器”中的 href 内容,但在我实际使用我的真实浏览器浏览时显示它?

我怎样才能绕过它?

4

1 回答 1

0

通过设置 userAgent 方法的参数解决了这个问题:

Document doc2 = Jsoup.connect(website).userAgent("Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0)").get();
于 2012-06-21T08:04:16.483 回答