1

我正在使用 PhantomJS 填写并提交表单,然后输出结果页面。问题是,我根本不知道这件事是否正在提交。

我打印结果页面,但它与原始页面相同。我不知道这是因为它重定向回来还是我没有提交或者我需要等待更长时间或或或。在真正的浏览器中,它发送一个 GET 并接收一个 cookie,它使用它来发送更多的 GETS,然后最终接收到最终结果 - 航班数据。

我复制了这个示例How to submit a form using PhantomJS,使用不同的 url 和 page.evaluate 函数。

var page = new WebPage(), testindex = 0, loadInProgress = false;

page.onConsoleMessage = function(msg) {
  console.log(msg);
};

page.onLoadStarted = function() {
  loadInProgress = true;
  console.log("load started");
};

page.onLoadFinished = function() {
  loadInProgress = false;
  console.log("load finished");
};

var steps = [
  function() {
    //Load Login Page
    page.open("http://www.klm.com/travel/dk_da/index.htm");
  },
  function() {
    //Enter Credentials
    page.evaluate(function() {

                     $("#ebt-origin-place").val("CPH");
                    $("#ebt-destination-place").val("CDG");
                    $("#ebt-departure-date").val("1/5/2013");
                    $("#ebt-return-date").val("10/5/2013");

    });
  }, 
  function() {
    //Login
    page.evaluate(function() {

    $('#ebt-flightsearch-submit').click() ; 

     # also tried:
     # $('#ebt-flight-searchform').submit();   

    });
  }, 
  function() {
    // Output content of page to stdout after form has been submitted
    page.evaluate(function() {
      console.log(document.querySelectorAll('html')[0].outerHTML);
    });
  }
];


interval = setInterval(function() {
  if (!loadInProgress && typeof steps[testindex] == "function") {
    console.log("step " + (testindex + 1));
    steps[testindex]();
    testindex++;
  }
  if (typeof steps[testindex] != "function") {
    console.log("test complete!");
    phantom.exit();
  }
}, 50);
4

1 回答 1

0

感兴趣的站点是相当复杂的刮。我记录了来自美国荷航网站的 HTTP 流量并得到了这个:

GET /travel/us_en/apps/ebt/ebt_home.htm?name=on&ebt-origin-place=New+York+-+John+F.+Kennedy+International+%28JFK%29%2CNew+York&ebt-destination-place=Paris+- +查尔斯+德+高乐+机场+%28CDG%29%2C+法国&c%5B0%5D.os=JFK&c%5B0%5D.ost=机场&c%5B0%5D.ds=CDG&c%5B0%5D.dst=机场&c%5B1 %5D.os=CDG&c%5B1%5D.ost=机场&c%5B1%5D.ds=JFK&inboundDestinationLocationType=机场&redirect=no&chdQty=0&infQty=0&c%5B0%5D.dd=2013-07-31&c%5B1%5D.dd=2013 -08-14&c%5B1%5D.format=dd%2Fmm%2Fyyyy&flex=true&ebt-cabin-class=ECONOMY&adtQty=1&goToPage=&cffcc=ECONOMY&sc=false HTTP/1.1

您为表单元素注入的值不是他们的服务器正在寻找的。

在 page.evaluate() 内部,您是沙盒的,但示例代码包含一个挂钩,用于将沙盒控制台活动获取到外部控制台。对于其他调试,您还可以包括对象检查器等,但它们必须注入到页面或传递给评估()的部分代码中。

于 2013-07-24T23:51:08.513 回答