0

我制作了一个浏览博客以获取所有标题的报废脚本。问题是 Node 在脚本运行时使用越来越多的内存(数千个 URL),直到 8 go(最大),然后脚本崩溃。

我的脚本使用循环,必须有一种简单的方法来清除内存?

这是一个代码示例:

var request = require('request'),
httpAgent = require('http-agent'),
jsdom = require('jsdom').jsdom,
myWindow = jsdom().createWindow(),
$ = require('jquery'),
jq = require('jquery').create(),
jQuery = require('jquery').create(myWindow),
profiler = require('v8-profiler');

profiler.startProfiling();

request({ uri:'http://www.guylabbe.ca' }, function (error, response, body) {
  if (error && response.statusCode !== 200) {
    console.log('Error when contacting URL')
  }


        var last_page_lk = $(body).find('.pane-content .pager li:last-child a').attr('href');
        var nb_pages = last_page_lk.substring(last_page_lk.indexOf('=')+1);
        var page_lk_base = last_page_lk.substring(0,last_page_lk.indexOf('='));

        var pages = Array();
        pages.push(page_lk_base);
        for(var i=1;i<=nb_pages;i++) {
            pages.push(page_lk_base+'='+i);
        }


        // parser les pages

        var fiches = Array();
        var agent2 = httpAgent.create('www.guylabbe.ca', pages);

        agent2.addListener('next', function (err, agent2) {

            var snapshot = profiler.takeSnapshot();


            $(body).find('.view span.field-content span.views-field-title').each(function(){
                fiches.push($(body).find(this).parents('a').attr('href'));
                //console.log($(body).find(this).html());
            });


            agent2.next();

        });
        agent2.start();

        agent2.addListener('stop', function (agent) {
          console.log('-------------------------------- (fini de cumuler les URL fiches) --------------------------------');

            // Parser les fiches

            var agent_fiches = httpAgent.create('www.guylabbe.ca', fiches);

            agent_fiches.addListener('next', function (err, agent_fiches) {

                console.log('log info');


                agent_fiches.next();

            });
            agent_fiches.start();

            agent_fiches.addListener('stop', function (agent) {
              console.log('-------------------------------- Eh voilà! --------------------------------');
            });

            agent_fiches.addListener('start', function (agent) {
              console.log('-------------------------------- C est parti... --------------------------------');
            });

        });



});
4

2 回答 2

1

在您不再需要它们的地方显式地为空变量。如果您在闭包外部创建变量,并在闭包内部使用它,那么当您不再需要它时应该将其设为空。看到这个线程并阅读接受的答案:如何防止 node.js 中的内存泄漏?

于 2013-01-28T20:54:25.320 回答
1

我遇到了与 jsdom 泄漏内存类似的问题。在我的情况下,通过解决它来关闭 jsdom 窗口。也许你应该myWindow.close()在完成刮擦后添加。查看相关答案https://stackoverflow.com/a/6891729/1824928

于 2013-01-28T21:26:59.013 回答