0

我是网络抓取的新手。对于使用惊人的 API Jaunt 进行抓取。我想填写表单字段并在提交表单时遇到问题,因为使用的输入类型是图像而不是提交按钮。

示例代码:

try {
            userAgent = new UserAgent();try {
            userAgent.visit("http://www.xxxx.com/section");          /
            } catch (ResponseException ex) {
                Logger.getLogger(JTicket.class.getName()).log(Level.SEVERE, null, ex);
            }
             Document doc = userAgent.doc;
             System.out.println(doc);
             Form form = userAgent.doc.getForm("<form name=browse>"); 
             form.setHidden("root", "10004");
             form.setHidden("category", "7");
             form.setHidden("rdc_select", "tw");
             form.submit("go");

背景代码:

    <form onsubmit="if (preProcessBrowse()) submitBrowseForm(this); return false;" id="ccs_form" name="browse" action="/browse">
  <input type="image" src="http://s1.ticketm.net/tm/en-us/img/sys/1000/blank.gif" title="Go" alt="Go" name="go" id="browse_go_button" class="go mgTop5 floatRight">
  <div class="clear">
  </div>
  <input type="hidden" value="tm_homeA_browse" name="tm_link">
  <input type="hidden" value="10004" id="root" name="root">
  <input type="hidden" value="7" id="category" name="category">
  <input type="hidden" value="mm" id="rdc_smonth" name="rdc_smonth">
  <input type="hidden" value="dd" id="rdc_sday" name="rdc_sday">
  <input type="hidden" value="yyyy" id="rdc_syear" name="rdc_syear">
  <input type="hidden" value="mm" id="rdc_emonth" name="rdc_emonth">
  <input type="hidden" value="dd" id="rdc_eday" name="rdc_eday">
  <input type="hidden" value="yyyy" id="rdc_eyear" name="rdc_eyear">
  <input type="hidden" value="tw" id="rdc_select" name="rdc_select">
  <input type="hidden" id="type" name="type" value="selected">
</form

图片:

在此处输入图像描述

请帮助我,如何使用 Jaunt 提交表单。

谢谢

4

2 回答 2

0

我知道这是一个旧帖子,但它可能对其他人有帮助 这可能会帮助你

http://jaunt-api.com/jaunt-tutorial.htm

于 2015-07-06T14:09:13.833 回答
0

您删除参数并尝试 form.submit() 可能会起作用。

于 2018-05-10T13:54:26.233 回答