我编写了一个 Java 小程序,它从单个主机的多个页面中获取 HTML 内容并从中提取数据。我使用 Jsoup,它运行良好,但它会自动为浏览器中设置的主机使用 cookie,并在后续请求中发送新设置的 cookie。(我相信这是由 Java 本地完成的)
我希望它在运行小程序时忽略服务器设置的所有 cookie,并忽略浏览器可能已经拥有的任何 cookie。
我的代码非常简单。
String url = "http://example.com/my/web-page.html";
Document document = Jsoup.connect(url).userAgent("<hard-coded static value>").get();
// Extract data from document with org.Jsoup.nodes.Document.select(), etc.
这会重复使用多个 URL,所有 URL 都具有相同的主机 (example.com)。
总之,我基本上希望它:
- 忽略可能在浏览器中设置的 example.com 的任何 cookie。
- 如果小程序发出请求时服务器设置了任何新的 cookie,则在后续请求中忽略它。如果可能,还要阻止 cookie 存储在浏览器中。
我已经搜索了很多,但无法找到解决方案。我真的很感激任何帮助。我不介意使用 Apache HTTPClient 或任何其他第三方库,但我不想这样做,这样我可以保持小程序的文件大小很小。
提前致谢:)