1

我正在尝试从 url 列表中下载 .html 中的网页,但是其中一些网站使用会话 cookie,当我尝试 Jsoup.connect("url") 时,我得到了 403。
所以,我使用了 Map / HashMap至于如何使用 Jsoup 管理 cookie,使用 Jsoup维护 cookie 和会话,检索 cookie..,但仍然是 403。

真正让我惊讶的是,像 Mac Automator 这样一个非常简单的应用程序可以完成这项工作,实际上只保存文本而不是 html,但是仍然......

有谁知道如何克服这个cookie挫折?使用此页面的示例会很棒。http://pubs.acs.org/doi/full/10.1021/ja312087x

谢谢!!!

4

1 回答 1

1

看看这个答案https://stackoverflow.com/a/15369631/516167

您需要打开页面,然后发送表单数据(登录名、密码)、cookie 和 POST 所需的其他参数。

于 2013-03-15T22:18:38.930 回答