0

我只是在用java做数据提取的事情,在这个论坛搜索,发现它被称为屏幕抓取。我一直在寻找 java 的屏幕刮板库,并找到 JSoup 来解析结果。

我的问题是目标网站在提交搜索表单时使用 post 方法,它不容易重新生成它,我也使用 chrome 中的开发人员工具检查提交操作后的响应代码是 302 并重定向到某个页面,然后再次重定向到结果页面。

请有人给我一个提示或指向我如何使用 jsoup 的教程。就我而言,我尝试从 ai*ras*ia.*com 检索航班时刻表

4

1 回答 1

0

在 JSOUP 中有一个名为 .followRedirects(followRedirects) 的函数,它可以让您选择是否要跟踪重定向,默认情况下它设置为“true”。

这些是它允许重定向的 HTTP 代码:

  • 301 - HTTP_MOVED_PERM
  • 302 - HTTP_MOVED_TEMP
  • 303 - HTTP_SEE_OTHER
于 2013-02-15T17:18:50.493 回答