我必须点击网址http://judis.nic.in/supremecourt/chejudis.asp。在此处提交表单以获取应该报废的页面。我正在使用 PhantomJS 和 PJScrape 。问题是,表单提交后,结果显示在新窗口中。我浏览了 phantomjs 问题列表,发现 windown.open 无法处理。我可以在这里使用任何其他方式/框架吗?我必须坚持无头刮擦,我不能使用 Selenium 等。
问问题
1308 次
1 回答
0
您可以像这样将页面中的javascript注入monkey-patch window.open:
var log = {};
window.my_open = window.open;
window.open=function (str1,str2,str3){
console.log("** window.open ** " + str1 + " / " + str2 + " / " + str3);
log.open = {"url":str1, "name":str2, "features":str3};
var new_win = this.my_open(str1, str2,str3);
return new_win;
}
然后您可以从 PJS 中访问 url 并继续从那里抓取。
请注意, new_win 将是“未定义的”,因为 PJS 没有实现它。
于 2012-08-14T14:01:14.690 回答