13

我在玩 node.js,发现这个简单的程序运行得非常慢,我什至没有等到 3 分钟过去后花了多长时间。

var fs = require ('fs')
var s = fs.createWriteStream("test.txt");
for (i = 1; i <= 1000000; i++)
      s.write(i+"\n");
s.end()

我尝试使用不同的值,发现 1-112050 需要 3 秒,而 1-112051 需要一分钟。这种突然的下降很奇怪。python 中的相同程序或等效的 shell 脚本“seq 1 112051”在合理的时间内(0-2 秒)运行。

请注意,这个 node.js 应用程序运行得更快:

var fs = require('fs')
     , s = []
for (var i = 1; i <= 1000000; i++) s.push(i.toString())
s.push('')
fs.writeFile('UIDs.txt', s.join('\n'), 'utf8')

谁能向我解释为什么 node.js 会这样,以及为什么下降如此突然?

4

3 回答 3

13

发生这种情况是因为for循环是同步的,但Writable.write()不是。对于您的示例 s.write 创建一百万块队列。这导致超过一百万个函数调用(像这样)来处理这个队列。所以,Writable.write不是为小块设计的。您可以查看来源Writable.write获取有关它的更多信息。

于 2013-01-28T01:54:49.950 回答
6

这是一个被填满的缓冲区。每次写入都将返回truefalse取决于内核缓冲区的状态。

如果你开始听返回码并使用drain事件,它至少会在速度上保持一致。

var fs = require ('fs') 

function runTest(stop) {
  var s = fs.createWriteStream("test.txt");
  var startTime = Date.now();
  var c = 1;
  function doIt() {
    while (++c <= stop) {
      if (!s.write(c+"\n")) {
        s.once('drain', doIt);
        return;
      }
    }

    s.end();
    var diffTime = Date.now() - startTime;
    console.log(stop+': took '+diffTime+'ms, per write: '+(diffTime/stop)+'ms')
  }

  doIt();
}

runTest(10000);
runTest(100000);
runTest(1000000);
runTest(10000000);
runTest(100000000);

输出:

$ node test.js
10000: took 717ms, per write: 0.0717ms
100000: took 5818ms, per write: 0.05818ms
1000000: took 42902ms, per write: 0.042902ms
10000000: took 331583ms, per write: 0.0331583ms
100000000: took 2542195ms, per write: 0.02542195ms
于 2013-01-30T01:15:28.990 回答
-3

我相信这可能是特定于环境的,您在什么情况下编写此代码?例如,最初我认为它是用于网站的,但它涉及编写文件,这让我很反感。

否则,根据实现,使用文件系统的工作很有趣,我不应该责怪编程语言,但我真的不知道 javascript 如何处理特定系统上的文件 IO,文件 IO 的性能本身就是一门科学,可能与计算机科学本身一样古老。

于 2013-01-28T00:10:22.547 回答