[ phantomjs -v 1.9.7 ] 与 NightmareJS: https ://github.com/segmentio/nightmare
通过使用超时选项的一个示例,我可以看到最好的选项设置:
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
也试过
new Nightmare({ignoreSslErrors : true, sslProtocol : 'tlsv1'})
它不会打开 https 页面。
如果我直接使用 phantomjs 来访问同一页面,它可以正常工作:
phantomjs --ignore-ssl-errors=true --ssl-protocol=tlsv1 testBot.js
页面标题是登录
*** testBot.js
var page = require('webpage').create();
var url = 'https://www.some-https-site/login/';
page.onConsoleMessage = function(msg) {
console.log('Page title is ' + msg);
};
page.open(url, function(status) {
page.evaluate(function() {
console.log(document.title);
});
phantom.exit();
});
这段代码非常混乱,但是当我将站点切换回 HTTP 而不是 HTTPS 时,它可以完美运行。
// Main nightmare call
// Code is quite messy, i know.
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
.useragent('chrome')
.use(openpage())
.evaluate(function() {
return document.title;
},function(title) {
// console.info('FALSE = not logged in');
console.info('title : ' + title);
if (title === 'Login'){
console.info('false');
loginCheckBit = false;
}else if (title === 'Print Invoice'){
loginCheckBit = true;
console.info('true');
}else{
console.info('#########################################');
console.info(' NEED TO TROUBLESHOOT scraper looks lost');
console.info('#########################################');
}
})
.run(function(err, nightmare){
if (err){
console.info('err : ' + err);
}
if (!loginCheckBit){
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
.use(login(user))
.use(screenshot())
.evaluate(function() {
return document.title;
},function(title) {
console.info('#################');
console.info('title : ' + title);
makePDF();
})
.run(function(err, nightmare){
if (err){
console.info('err : ' + err);
}
});
}else{
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
.use(openpage())
.use(screenshot())
.evaluate(function() {
return document.title;
},function(title) {
console.info('################');
console.info('inside 2nd eval');
console.info('title : ' + title);
makePDF();
})
.run(function(err, nightmare){
if (err){
console.info('err : ' + err);
}
});
}
});
function openpage(user){
console.info('============ BOT URL CALL =============');
console.info(rootURL + '/account/invoices/'+req.params.id+'/printerFriendly/');
console.info('====================================');
return function(nightmare){
nightmare
.goto(rootURL + '/account/invoices/'+req.params.id+'/printerFriendly/')
.wait();
};
}
function login(user){
return function(nightmare){
nightmare
.goto(rootURL + '/account/invoices/'+req.params.id+'/printerFriendly/')
.type("input[name='username']", user.name)
.type("input[name='password']", user.pass)
.click('.btn-login')
.wait();
};
}
我知道 HTTPS 在调用“登录”功能时失败并且找不到输入框:
.type("input[name='username']", user.name)
.type("input[name='password']", user.pass)
Nightmare 会为输入框返回错误并且页面的标题为空。它应该是:“登录”或“打印发票”,具体取决于“机器人”是否登录。
以下线程让我在“tlsv1”方面朝着正确的方向前进:PhantomJS 无法打开 HTTPS 站点,但我无法让它在 Nightmare 中工作。