4

我正在尝试使用 Java 向 deaptcher.com 提交验证码。Decaptcher 并没有很好地解释如何使用他们的 API,所以我试图弄清楚如何使用 HTTP POST 请求来提交验证码。这是我从他们的网站上获得的示例代码:

<form 
 method="post" 
 action="http://poster.decaptcher.com/" 
 enctype="multipart/form-data">
 <input type="hidden" name="function"  value="picture2">
 <input type="text"   name="username"  value="client">
 <input type="text"   name="password"  value="qwerty">
 <input type="file"   name="pict">
 <input type="text"   name="pict_to"   value="0">
 <input type="text"   name="pict_type" value="0">
 <input type="submit" value="Send">
</form>

我应该向 Web 服务器发送一个这样的 post 请求并得到一个返回给我的字符串。这是我在 Java 中实现它的尝试。

public String getDecaptcherAnswer(String username, String password){
        try{
            URL decaptcherPostURL = new URL("http://poster.decaptcher.com/");
            WebRequestSettings request = new WebRequestSettings(decaptcherPostURL, HttpMethod.POST);
            request.setEncodingType(FormEncodingType.MULTIPART);
            ArrayList<NameValuePair> params = new ArrayList<NameValuePair>();
            params.add(new NameValuePair("function", "picture2"));
            params.add(new NameValuePair("username", username));
            params.add(new NameValuePair("password", password));

            //I added this block in 
            File file = new File("captcha.png");
            params.add(new KeyDataPair("pict", capFile, "png", "utf-8"));
            //----------------------

            params.add(new NameValuePair("pict_to", "0"));
            params.add(new NameValuePair("pict_type", "0"));
            request.setRequestParameters(params);
            request.setUrl(decaptcherPostURL);

            HtmlPage page = webClient.getPage(request);
            System.out.println(page.asText());
            System.out.println("--------------------------------------");
            System.out.println(page.asXml());

            return page.asText();
        }catch (Exception e){
            e.printStackTrace();
            return null;
        }
}

我是否应该将 pict 的值设置为 File 对象而不是指向存储验证码的位置的字符串?(captcha.png 是我要提交的图像的名称)。

4

3 回答 3

3

有一个更高级别的机制来发送该文件,您无需创建WebRequestSettings和设置其单独的值。

您应该在某处托管该静态 html 并执行以下操作。

如果您仍有问题,请在 HtmlUnit 错误跟踪器中提交错误报告。

BTW,HtmlUnit 2.8 即将发布,试一试。

WebClient webClient = new WebClient();
HtmlPage page = webClient.getPage("http://some_host/test.html");
HtmlForm form = page.getForms().get(0);
form.getInputByName("username").setValueAttribute(username);
form.getInputByName("password").setValueAttribute(password);
form.getInputByName("pict_to").setValueAttribute("0");
form.getInputByName("pict_type").setValueAttribute("0");
form.getInputByName("pict").setValueAttribute("full_path_to_captcha_png");
form.<HtmlFileInput>getInputByName("pict").setContentType("image/png");//optional
HtmlPage page2 = form.getInputByValue("Send").click();
于 2010-08-04T09:41:04.240 回答
1

您不应NameValuePair为此使用 a ,而应使用它的子类KeyDataPair. 这样您就可以指定要上传的文件。

以下应该有效:

new KeyDataPair("pict", new File(fileName), "image/png", "utf-8");

内容类型参数是文件的MIME类型。由于您要上传 PNG 文件,因此它应该是image/png.

于 2010-08-02T16:31:42.123 回答
0

这是我试图输入的内容:

File file = new File("captcha.png");
params.add(new KeyDataPair("pict", capFile, "png", "utf-8"));

PNG文件是用UTF-8编码的吗?这就是我为文件输入指定 KeyDataPair 的方式吗?我想我要么指定了错误的 contentType 或错误的 charSet,要么同时指定了两者。我应该把它们全部大写吗?

于 2010-08-03T02:02:52.537 回答