0

我需要为一个项目搜集法国法庭案件,但我不知道如何让 Java 浏览法庭的搜索引擎。

这是我需要操作的搜索页面。我想开始抓取结果页面,但我无法仅通过 URL 从 Java 访问该页面。我需要一些方法让 Java 命令服务器根据我的日期参数(01/01/2003 - 30/06/2003)执行搜索,然后我可以通过简单地操作我要连接的 URL 来运行节目.

有什么建议么?

4

1 回答 1

1

首先确保网站的服务条款允许这样做。

我会httpclient发布数据以发送数据并获取结果。查看页面上的表格,找出您需要模拟的变量并使用 httpclient 提交它们。您应该取回您正在寻找的结果。此外,这个页面有很多 javascript,所以你需要弄清楚它在做什么,也许它从不提交表单而是进行 ajax 调用来更新页面,但也许你可以获得相同的结果。

您总是可以安装类似“ fiddler ”的东西并观察页面发送的 http 流量,然后使用 httpclient 模拟它。

于 2010-08-16T17:18:03.280 回答