35

我想在 node.js 中使用 CasperJS。

我参考了以下 URL 在 node.js 中使用 CasperJS:

在上述 URL 的帮助下,我编写了以下代码:

//DISPLAY=:0 node test2.js
var phantom = require('phantom');
console.log('Hello, world!');
phantom.create(function (ph) {
    ph.casperPath = '/opt/libs/casperjs'
    ph.injectJs('/opt/libs/casperjs/bin/bootstrap.js');
    var casper = require('casper').create();
    casper.start('http://google.fr/');

    casper.thenEvaluate(function (term) {
        document.querySelector('input[name="q"]').setAttribute('value', term);
        document.querySelector('form[name="f"]').submit();
    }, {
        term: 'CasperJS'
    });

    casper.then(function () {
        // Click on 1st result link
        this.click('h3.r a');
    });

    casper.then(function () {
        console.log('clicked ok, new location is ' + this.getCurrentUrl());
    });

    casper.run();
});

当我运行此代码时,出现以下错误:

错误信息:

tz@tz-ubuntu:/opt/workspaces/TestPhantomjs$ DISPLAY=:0 node test2.js 
Hello, world!
Error: Cannot find module 'casper'
    at Function._resolveFilename (module.js:332:11)
    at Function._load (module.js:279:25)
    at Module.require (module.js:354:17)
    at require (module.js:370:17)
    at /opt/workspaces/TestPhantomjs/test2.js:6:14
    at Object.<anonymous> (/opt/workspaces/TestPhantomjs/node_modules/phantom/phantom.js:82:43)
    at EventEmitter.<anonymous> (/opt/workspaces/TestPhantomjs/node_modules/phantom/node_modules/dnode/index.js:215:30)
    at EventEmitter.emit (events.js:67:17)
    at handleMethods (/opt/workspaces/TestPhantomjs/node_modules/phantom/node_modules/dnode-protocol/index.js:138:14)
    at EventEmitter.handle (/opt/workspaces/TestPhantomjs/node_modules/phantom/node_modules/dnode-protocol/index.js:98:13)
phantom stdout: Unable to load casper environment: Error: Failed to resolve module fs, tried fs
4

6 回答 6

25

您可以使用SpookyJS从 Node.js 驱动 CasperJS。

于 2012-10-04T06:23:20.497 回答
21

https://groups.google.com/group/casperjs/browse_thread/thread/641e9e6dff50fb0a/e67aaef5ab4ec918?hl=zh-CN#e67aaef5ab4ec918

Nicolas Perriault
2012/2/27 天猪蓝虫。:

我想在 nodejs 中使用 casperjs。并参考: https ://github.com/sgentle/phantomjs-node和 http://casperjs.org/index.html#faq-executable

你不能那样运行 CasperJS;QtWebKit 和 V8 不共享相同的 js 环境(和事件循环),因此您的 node.js 应用程序将无法加载和使用 CasperJS 模块。您必须使用子进程调用单独运行您的 CasperJS 脚本, 例如 github 上的这个。我不打算让 CasperJS 与 phantomjs-node 兼容,因为它使用 alert()了我不容易使用的基于 -based 的脏黑客。

干杯,——尼古拉斯·佩里奥

于 2012-02-28T17:16:14.780 回答
17

CasperJS 包含一个与外界对话的网络服务器。Node(使用requestsuperagent)现在可以通过 HTTP 与 casper 通信。

scraper.js

#!/usr/bin/env casperjs

// I AM NOT NODEJS
// I AM CASPER JS
// I RUN IN QTWEBKIT, NOT V8

var casper = require('casper').create();
var server = require('webserver').create();
var ipAndPort = '127.0.0.1:8585';

server.listen(ipAndPort, function(request, response) {

    casper.start('https://connect.data.com/login');
    casper.userAgent("Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.106 Safari/537.36");
    casper.then(function(){
        // lots of code here, and a few more cassper.then()s
    });

    casper.run(function(){
        console.log('\n\nFinished')
        response.statusCode = 200;
        var body = JSON.stringify({
            phoneNumber: '1800-YOLO-SWAG'
        })

        response.write(body);
        response.close();
    });
});

您现在可以scraper.js作为 Web 服务器运行:

chmod +x scraper.js
./scraper.js

您应该像运行节点应用程序一样将其作为 Linux 服务运行

于 2013-05-14T21:57:30.300 回答
3

一种解决方案(对我有用)是在每次测试的基础上启动和停止您的服务器。例如,我有一个runtests.coffee看起来像:

http = require 'http'
glob = require 'glob'
spawn = require('child_process').spawn

db = require './db' # Contains all database stuff.
webapp = require './webapp' # Contains all of the Express stuff.

db.connect 'test' # Connects to the db server and creates an empty test db.
server = http.createServer webapp.makeApp()
server.listen 0, ->
    port = server.address().port
    process.env.URL = "http://localhost:#{ port }"
    glob 'tests/*', (err, filenames) ->
        child = spawn 'casperjs', ['test'].concat(filenames)
        child.stdout.on 'data', (msg) -> process.stdout.write msg
        child.stderr.on 'data', (msg) -> process.stderr.write msg
        child.on 'exit', (code) ->
            db.disconnect() # Drops the test db.
            server.close()
            process.exit code

我的 CasperJS 测试tests/看起来像:

URL = require('system').env.URL # Note, Casper code here, not Node.

casper.test.begin 'Test something', 1, (test) ->
    casper.start "#{ URL }/welcome"
    casper.then ->
        test.assertHttpStatus 200
        # ....
    casper.run ->
        test.done()
于 2013-08-14T23:05:02.217 回答
0

这基本上意味着您的脚本找不到Casper;你检查过路径并确保

/opt/libs/casperjs 

和:

/opt/libs/casperjs/bin/bootstrap.js

网站用户可以访问吗?考虑到它可能不太可能的位置。/opt 是一个 unix 路径,但该网站将在 {websiterootpath}/opt 中查找。

我会在您网站的根文件夹中创建一个子文件夹“casperjs”并复制

/opt/libs/casperjs 

到那里。然后改变你的路径

/opt/libs/casperjs

/casperjs
于 2012-02-27T01:48:06.357 回答
0

我也尝试通过节点 cron 作业运行 casper,这是我的解决方案

在 casper.js 中回显您的回复:

casper.then(function() {
    var comments = this.evaluate(getComments);
    this.echo(JSON.stringify(comments));
})

在节点文件 casper_wrapper.js 中使用 node-cmd:

var cmd = require('node-cmd');

module.exports = function(url) {
    return new Promise(function(resolve, reject) {
        cmd.get(
            'casperjs casper.js ' + url, // casper takes args to run the script
            function(err, data, stderr){
                if (err) {
                    reject(err);
                    return;
                }
                var obj = JSON.parse(data);
                resolve(obj);
            }
        );
    });
}
于 2018-09-19T15:44:01.240 回答