2

我有一个函数,我想调用 100 万次。该函数对数据库进行两次调用(首先是 SELECT,然后是 UPDATE)。我目前的方法是将这些函数存储在一个数组中,然后在这个数组上调用 async.parallel。

恐怕它会导致 ENOMEM 或其他东西。

这里有更好的方法吗?

4

2 回答 2

4

您可以使用生成器进行队列:

var totalTasks = 1000000;
var nTasks = 0;

// Generate data to send to query 
var getData = (function() {
    var i = 0;

    return function() {
        i++;
        return {
            number: i
        };
    };

})();

// Create the task running each time
var task = function(data, done) {
    nTasks++;
    console.log("Make task", nTasks);
    doQuery(data, done);
};

// Create queue with a limit concurrency
var queue = async.queue(task, 10); // <- parallels queries*

// The callback execute each task was execute
var cb = function(err) {
    if (err) throw err;

    // Add new tasks to queue if is neccesary    
    if (nTasks < totalTasks && queue.length() < queue.concurrency) {
        queue.push(getData(), cb);
    }

};

var i;

// Add the first x tasks to queue
for (i = 0; i < queue.concurrency; i++) {
    queue.push(getData(), cb);
}
  • 您需要考虑连接池的大小,或者 MySQL 的最大当前进程数。
于 2015-10-30T19:18:55.630 回答
0

如果你想处理每一行,你可以使用Mysql stream,所以你可以对每一行应用你想要的任何东西(在你的情况下更新);

于 2015-10-30T18:32:02.557 回答