0

我必须点击网址http://judis.nic.in/supremecourt/chejudis.asp。在此处提交表单以获取应该报废的页面。我正在使用 PhantomJS 和 PJScrape 。问题是,表单提交后,结果显示在新窗口中。我浏览了 phantomjs 问题列表,发现 windown.open 无法处理。我可以在这里使用任何其他方式/框架吗?我必须坚持无头刮擦,我不能使用 Selenium 等。

4

1 回答 1

0

您可以像这样将页面中的javascript注入monkey-patch window.open:

var log = {};
window.my_open = window.open;    
window.open=function (str1,str2,str3){
    console.log("** window.open ** " + str1 + " / " + str2 + " / " + str3);
    log.open = {"url":str1, "name":str2, "features":str3};
    var new_win =  this.my_open(str1, str2,str3);
    return new_win;
}

然后您可以从 PJS 中访问 url 并继续从那里抓取。

请注意, new_win 将是“未定义的”,因为 PJS 没有实现它。

于 2012-08-14T14:01:14.690 回答