1

我正在构建一个程序来从一个网页获取信息并将其输入另一个网页,解析信息的原始页面不是问题,但我不知道如何从文本文件中获取该信息并进入文本字段使用脚本的不同网站。谷歌没有帮助,那么这可以用 java 完成吗?

4

2 回答 2

2

您可以采取 2 条路线来执行此操作:

1) 使用HttpClient之类的库,并将您收集的信息直接发布到网站上。

2)使用像Selenium这样的 Web 测试框架与浏览器交互并填写表单。

选项 1 是迄今为止最强大和最快的,但是 (2) 让您使用目标可能依赖的任何客户端代码 (javascript)。

于 2012-06-30T09:04:32.417 回答
1

如果问题是如何在 Java 中以编程方式提交表单,我建议查看Apache HTTP Components Client,这是一个为您完成所有艰苦工作的类库。

文档非常好,所以我建议你至少先阅读他们的教程,但这是我从他们的网站借来的一个小代码片段,它展示了如何发布带有变量用户和密码的表单

PostMethod post = new PostMethod("http://jakarata.apache.org/");
NameValuePair[] data = {
  new NameValuePair("user", "joe"),
  new NameValuePair("password", "bloggs")
};
post.setRequestBody(data);
// execute method and handle any error responses.
...
InputStream in = post.getResponseBodyAsStream();
// handle response.

现在,我同意 Marijn 和 Jared 的观点,如果这是一次性的,那可能就不值得了,使用 cURL 或 Selenium 等一些创造性的脚本将是解决问题的更快方法。

于 2012-06-30T09:02:48.487 回答