我制作了一个浏览博客以获取所有标题的报废脚本。问题是 Node 在脚本运行时使用越来越多的内存(数千个 URL),直到 8 go(最大),然后脚本崩溃。
我的脚本使用循环,必须有一种简单的方法来清除内存?
这是一个代码示例:
var request = require('request'),
httpAgent = require('http-agent'),
jsdom = require('jsdom').jsdom,
myWindow = jsdom().createWindow(),
$ = require('jquery'),
jq = require('jquery').create(),
jQuery = require('jquery').create(myWindow),
profiler = require('v8-profiler');
profiler.startProfiling();
request({ uri:'http://www.guylabbe.ca' }, function (error, response, body) {
if (error && response.statusCode !== 200) {
console.log('Error when contacting URL')
}
var last_page_lk = $(body).find('.pane-content .pager li:last-child a').attr('href');
var nb_pages = last_page_lk.substring(last_page_lk.indexOf('=')+1);
var page_lk_base = last_page_lk.substring(0,last_page_lk.indexOf('='));
var pages = Array();
pages.push(page_lk_base);
for(var i=1;i<=nb_pages;i++) {
pages.push(page_lk_base+'='+i);
}
// parser les pages
var fiches = Array();
var agent2 = httpAgent.create('www.guylabbe.ca', pages);
agent2.addListener('next', function (err, agent2) {
var snapshot = profiler.takeSnapshot();
$(body).find('.view span.field-content span.views-field-title').each(function(){
fiches.push($(body).find(this).parents('a').attr('href'));
//console.log($(body).find(this).html());
});
agent2.next();
});
agent2.start();
agent2.addListener('stop', function (agent) {
console.log('-------------------------------- (fini de cumuler les URL fiches) --------------------------------');
// Parser les fiches
var agent_fiches = httpAgent.create('www.guylabbe.ca', fiches);
agent_fiches.addListener('next', function (err, agent_fiches) {
console.log('log info');
agent_fiches.next();
});
agent_fiches.start();
agent_fiches.addListener('stop', function (agent) {
console.log('-------------------------------- Eh voilà! --------------------------------');
});
agent_fiches.addListener('start', function (agent) {
console.log('-------------------------------- C est parti... --------------------------------');
});
});
});