78

我正在处理 node.js 并发现了两种读取文件并将其发送到线路的方法,一旦我确定它存在并使用 writeHead 发送了正确的 MIME 类型:

// read the entire file into memory and then spit it out

fs.readFile(filename, function(err, data){
  if (err) throw err;
  response.write(data, 'utf8');
  response.end();
});

// read and pass the file as a stream of chunks

fs.createReadStream(filename, {
  'flags': 'r',
  'encoding': 'binary',
  'mode': 0666,
  'bufferSize': 4 * 1024
}).addListener( "data", function(chunk) {
  response.write(chunk, 'binary');
}).addListener( "close",function() {
  response.end();
});

如果有问题的文件很大,比如视频,我假设 fs.createReadStream 可能会提供更好的用户体验是否正确?感觉它可能不那么块状;这是真的?我还需要知道其他优点、缺点、注意事项或陷阱吗?

4

4 回答 4

62

一个更好的方法,如果你只是要将“数据”连接到“write()”和“关闭”到“end()”:

// 0.3.x style
fs.createReadStream(filename, {
  'bufferSize': 4 * 1024
}).pipe(response)

// 0.2.x style
sys.pump(fs.createReadStream(filename, {
  'bufferSize': 4 * 1024
}), response)

read.pipe(write)orsys.pump(read, write)方法的好处是还添加了流控制。因此,如果写入流不能尽快接受数据,它会告诉读取流后退,以尽量减少在内存中缓冲的数据量。

flags:"r"和由它是一个事实所mode:0666暗示FileReadStream。不推荐使用binary编码 - 如果未指定编码,它将仅适用于原始数据缓冲区。

此外,您还可以添加一些其他的好东西,让您的文件更加流畅:

  1. 嗅探req.headers.range并查看它是否与类似的字符串匹配/bytes=([0-9]+)-([0-9]+)/。如果是这样,您只想从该开始到结束位置进行流式传输。(缺少数字表示 0 或“结束”。)
  2. 将来自 stat() 调用的 inode 和创建时间散列到 ETag 标头中。如果您收到一个带有“if-none-match”的请求标头与该标头匹配,请发回一个304 Not Modified.
  3. 根据 stat 对象上的日期检查if-modified-since标题。mtime304 如果自提供的日期以来未修改。

另外,一般来说,如果可以的话,发送一个Content-Length标题。(你正在stat输入文件,所以你应该有这个。)

于 2011-01-04T07:07:07.117 回答
45

fs.readFile如您所指出的,会将整个文件加载到内存中,而 asfs.createReadStream将以您指定的大小块读取文件。

客户端还将开始更快地接收数据,fs.createReadStream因为它在读取时以块的形式发送出去,而 asfs.readFile将读取整个文件,然后才开始将其发送给客户端。这可能可以忽略不计,但如果文件很大并且磁盘很慢,则可能会有所不同。

想想看,如果你在一个 100MB 的文件上运行这两个函数,第一个将使用 100MB 内存来加载文件,而后者最多只使用 4KB。

编辑:我真的看不出你为什么要使用,fs.readFile特别是因为你说你将打开大文件。

于 2011-01-04T04:28:45.817 回答
4

如果它是一个大文件,那么“readFile”会占用内存,因为它会缓冲内存中的所有文件内容,并且可能会挂起您的系统。而 ReadStream 读取块。

运行此代码并在任务管理器的性能选项卡中观察内存使用情况。

 var fs = require('fs');

const file = fs.createWriteStream('./big_file');


for(let i=0; i<= 1000000000; i++) {
  file.write('Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.\n');
}

file.end();


//..............
fs.readFile('./big_file', (err, data) => {
  if (err) throw err;
  console.log("done !!");
});

事实上,你不会看到“完成!!” 信息。“readFile”将无法读取文件内容,因为缓冲区不足以容纳文件内容。

现在代替“readFile”,使用 readStream 并监视内存使用情况。

注意:代码取自 Pluralsight 上的 Samer buna Node 课程

于 2017-04-18T08:42:50.713 回答
0

另一个可能不太为人所知的事情是,我相信 Node 在使用后清理未使用的内存fs.readFile方面比fs.createReadStream. 您应该对此进行测试以验证最有效的方法。此外,我知道每一个新版本的 Node,这都会变得更好(即垃圾收集器在这些类型的情况下变得更加智能)。

于 2012-08-30T18:31:25.520 回答