1

我正在使用 CasperJS 从 HTML 数据中提取一些内容。为此,我在evaluate()函数中放了一些 jQuery 代码,但 jQuery 代码在那里不起作用。我不知道如何正确使用它。

我正在使用以下代码,示例:

var resultObj  =  [];

var casper = require('casper').create({
    pageSettings: {
       loadImages: false,
       loadPlugins: false,
       userAgent: 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/30.0.1588.0 Safari/537.36'
    },
});

casper.start();

//another codes

casper.traverseHtml =   function(){
    var executer    =   casper.evaluate(function(){
        var htmlText    =   '<div><div class="tp">x</div><div class="tp">y</div><div class="tp">z</div><div class="tp">p</div></div>';
        object = $('<div/>').html(htmlText).contents();         
        object.find('.tp').each(function(index, element) {
            resultObj.push({value:index});
        });  
        return resultObj;

    });
    resultObj   =   executer;
}
casper.then(function() {
    casper.traverseHtml();
});

//codes

casper.run(function() {
    this.echo(JSON.stringify(resultObj)).exit();
});

我得到了null这段代码的结果,但是当我将traverseHtml函数替换为,

casper.traverseHtml =   function(){
    var executer    =   casper.evaluate(function(){            
        return [{value:"1234"}];
    });
    resultObj   =   executer;
}

然后它给出输出,

[{"value":"1234"}]

我不知道如何纠正这个。

4

2 回答 2

1

首先尝试将 jQuery 变量传递给评估函数 - 可能是一个快速修复:

var executer    =   casper.evaluate(function($){

其次,验证远程页面是否有 jQuery 并检查版本。如果 jQuery 不存在,则注入(此处找到的文档):

var casper = require('casper').create({
    clientScripts: ["includes/jquery.min.js"]
});

如果使用旧版本的 jQuery,您可能需要在函数体中将 '$' 替换为 'jQuery'。尝试这个:

var executer    =   casper.evaluate(function($){
    var htmlText    =   '<div><div class="tp">x</div><div class="tp">y</div><div class="tp">z</div><div class="tp">p</div></div>';
    object = jQuery('<div/>').html(htmlText).contents();         
    object.find('.tp').each(function(index, element) {
        resultObj.push({value:index});
    });  
    return resultObj;
});

如果这些选项不起作用,请打开 Google Chrome 浏览器并在网页的控制台中测试您的 jQuery 代码。

于 2013-11-08T00:55:20.687 回答
1

PhantomJS 有两个上下文,因为 CasperJS 是建立在 PhantomJS 之上的,所以它有两个相同的上下文。您可以通过 访问页面/DOM 上下文casper.evaluate(),但它是沙盒的。这意味着您无法访问在回调函数之外定义的任何变量casper.evaluate()。您想在内部使用的所有内容都必须显式传入。有关更多信息,请参阅 PhantomJS文档

问题是您没有resultObj在页面上下文中定义,因此您不能pushundefined参考上做任何事情。

var executer = casper.evaluate(function(){
    var resultObj = []; // only additional line

    var htmlText = '<div><div class="tp">x</div><div class="tp">y</div><div class="tp">z</div><div class="tp">p</div></div>';
    var obj = $('<div/>').html(htmlText).contents();         
    obj.find('.tp').each(function(index, element) {
        resultObj.push({value:index});
    });  
    return resultObj;
});

我也改成object了局部变量obj

如果页面没有提供 jQuery,则需要自己包含:

var casper = require('casper').create({
    clientScripts: ["jquery.min.js"]
});

只要你把jquery.min.js你的运行目录。


如果您想查看隐藏在页面上下文中的实际错误,可以收听“page.error”事件

casper.on("page.error", function(msg, trace) {
    this.echo("Error: " + msg, "ERROR");
});

还有更多有趣的事件:示例

于 2014-06-29T12:44:41.343 回答