0

我是 JS 的新手,我被困在这一点上。我试图在开始新查询之前清除我的数据库,并且它一直停留在 collection.find 命令上。如果我删除了清除数据库的代码,一切正常。

router.get('/parse', function(req, res) {
    collection.remove({})
    collectionweb.remove({})
    collectionhit.remove({})
    //Converter Class
    var Converter = require("csvtojson").core.Converter;
    var fs = require("fs");
    var csvFileName = "./download/company.csv";
    var fileStream = fs.createReadStream(csvFileName);
    //new converter instance
    var param = {};
    var csvConverter = new Converter(param);
    request({
        uri: "http://online.barrons.com/news/articles/SB50001424053111904537004580085820431503044?mod=BOL_twm_fs",
    }, function(error, response, body) {
        collectionweb.insert({
            "website": body
        });
    });
    //end_parsed will be emitted once parsing finished
    csvConverter.on("end_parsed", function(jsonObj) {
        //Insert into DB
        collection.insert(jsonObj);
    });
    fileStream.pipe(csvConverter);
    collectionweb.find({}, function(e, docs1) {
        for (var j in docs1) {
            var body = docs1[j]
            var webs = body.website
            console.log(1)
            collection.find({}, function(e, docs) {
                for (var i in docs) {
                    console.log(2)
                    var companies = docs[i]
                    var Score = 0;
                    $words = webs.search(companies.Symbol);
                    console.log(3)
                    if ($words > 0) {
                        StockScore++console.log(Score)
                        collectionhit.insert(companies)
                        collectionhit.update({
                            "Name": companies.Name
                        }, {
                            '$set': {
                                "score": Score
                            }
                        })
                    } else {};
                };
            });
        };
    });
});
4

1 回答 1

2

有一些问题,但它们有一个共同点:您还不了解 Node.js 是异步的。只需谷歌“node.js 异步”,你就会得到一些资源,或者只是在 SO 上查找它(例如,我如何开始使用 Node.js?)。

它的要点是等待回调或事件,例如:

var eiot = new EventedIOThing('paaarammm');

// use once, unless you for sure need to listen for the event multiple times
eiot.once('open',function onEIOTOpen() {
    console.log('opened the thing.');
}).once('error',function onEIOTError(err) {
    console.warn('there were problemzzz');
}).once('end',function onEIOTEnd() {
    // successfully finished evented IO thing...
    someAction(this.dep,'anotherparam',function callMeWhenActionIsDone(err,result) {
        if ( err ) {
            console.warn('someAction had a problem!',err);
            return; // exit early if we didn't get an optimal result
        }
        anotherDependentAction(result,function callMeWhenSecondActionIsDone(err,result) {
            if ( err ) { // this 'err' is local to this function's scope
                console.warn('anotherDependentAction had a problem!',err);
                return; // exit early again
            }
            console.log('All done... what do you want to do next?');
        });
    });
});

考虑到变量/函数名称和注释,上面的代码很容易解释,但要密切注意调用方法的方式,尤其调用它们的时间。事情不会连续发生,而是代码处于“待机”状态,直到相关/适当的事情发生并获得成功的结果,然后程序流程才会继续。

上述编码风格的缺点是你最终会得到很多嵌套函数。这就是像async这样的库发挥作用的地方。它允许浅函数程序流程:您指定一个函数数组,并在内部调用回调时指定异步句柄,您只需要担心顺序。

现在,使用您当前拥有的代码,我们从第一个示例中学到的内容,并通过引入async 模块对其进行 1-upup ,它可以重写如下:

var async = require('async'), // https://github.com/caolan/async
    fs = require('fs'),
    Converter = require('csvtojson').core.Converter;

router.get('/parse',function cbGetParse(req, res) {
    async.series([
        collection.remove.bind(collection),
        collectionweb.remove.bind(collectionweb),
        collectionhit.remove.bind(collectionhit),
        function convertCsv(callback) {
            var cbCalled = false; // i don't trust csvtojson to handle errors properly
            fs.createReadStream('./download/company.csv')
                .once('error',function(err) {
                    if ( !cbCalled ) {
                        cbCalled = true;
                        callback(err,null);
                    }
                })
                .pipe(new Converter({})) // pipe returns an instance of the Converter object
                .once('end_parsed',function onConverterEnd(jsonObj) {
                    collection.insert(jsonObj,function cbCollInsert(err,result) {
                        if ( !cbCalled ) {
                            cbCalled = true;
                            callback(err,result);
                        }
                    });
                });
        },
        function barronsHttpRequest(callback) {
            request({
                uri: 'http://online.barrons.com/news/articles/SB50001424053111904537004580085820431503044?mod=BOL_twm_fs',
            },function cbRequest(err,response,body) {
                if ( err ) {
                    callback(err,null);
                    return; // if err, exit early
                }
                collectionweb.insert({'website':body},function cbCollWebInsert(err,result) {
                    callback(err,result);
                });
            });
        },
        function lastChunkOfCode(callback) {
            // not going to rewrite this, same principle applies as above
            collectionweb.find({}, function(e, docs1) {
                for (var j in docs1) {
                    var body = docs1[j]
                    var webs = body.website
                    console.log(1)
                    collection.find({}, function(e, docs) {
                        for (var i in docs) {
                            console.log(2)
                            var companies = docs[i]
                            var Score = 0;
                            $words = webs.search(companies.Symbol);
                            console.log(3)
                            if ($words > 0) {
                                StockScore++console.log(Score)
                                collectionhit.insert(companies)
                                collectionhit.update({
                                    "Name": companies.Name
                                }, {
                                    '$set': {
                                        "score": Score
                                    }
                                })
                            } else {};
                        };
                    });
                };
                callback();
            });
        }
    ],function asyncComplete(err,result) {
        // you don't specify how to respond to the request so...
        if ( err ) {
            console.warn('Problem with /parse:',err);
        }
        res.end();
    });
});

我对你的脚本应该如何工作做了很多假设,所以它可能不是你想要的 100%,但已经应用了异步概念。另外,我没有测试这段代码。您需要确定哪些可以并行运行和串行运行,您的控制流应该是什么样子,以及您希望如何处理错误(错误确实发生了)。

请注意,我没有在脚本的最后一块中实现异步行为,因为我无法弄清楚你的集合关系是什么——而且我不会为你做所有的工作。我确实注意到它可以进行一些优化。我看不出有任何理由从两个集合中选择所有文档。您需要将选择器/查询处理卸载到数据库中,如果您能提供帮助,它不应该出现在您的应用程序中。

一些要点:

  • Collection.remove(doc)接受回调,使用它。
  • Collection.insert(doc)相同——尽管文档说回调是可选的,但仅在极少数情况下才应省略。(我不在乎你是否使用写关注。)
  • 注意你的 for 循环:
  • for...in永远不应该使用A ,尤其是对于数组,使用普通forArray.forEach
  • 当对任何异步调用使用任何类型的for循环时——尤其是与套接字相关的,即 MongoDb——你需要耐心等待回调,否则你会淹没套接字(如拒绝服务攻击)。我建议使用async.eachSeriesasync.eachLimit
  • 我喜欢命名我的 Lambdas(矛盾修饰法?),它有助于剖析堆栈跟踪。
  • 请使用"',它们的作用完全相同,请勿混合使用。
  • 以较小的块发展。让一部分工作,然后是下一部分,然后是下一部分。工作小而抽象。
于 2014-08-21T22:49:31.400 回答