75

如何在请求的模块响应中解压缩压缩后的正文?

我在网上尝试了几个例子,但似乎没有一个有效。

request(url, function(err, response, body) {
    if(err) {
        handleError(err)
    } else {
        if(response.headers['content-encoding'] == 'gzip') {    
            // How can I unzip the gzipped string body variable?
            // For instance, this url:
            // http://highsnobiety.com/2012/08/25/norse-projects-fall-2012-lookbook/
            // Throws error:
            // { [Error: incorrect header check] errno: -3, code: 'Z_DATA_ERROR' }
            // Yet, browser displays page fine and debugger shows its gzipped
            // And unzipped by browser fine...
            if(response.headers['content-encoding'] && response.headers['content-encoding'].toLowerCase().indexOf('gzip') > -1) {   
                var body = response.body;                    
                zlib.gunzip(response.body, function(error, data) {
                    if(!error) {
                        response.body = data.toString();
                    } else {
                        console.log('Error unzipping:');
                        console.log(error);
                        response.body = body;
                    }
                });
            }
        }
    }
}
4

10 回答 10

68

我也无法获得工作请求,因此最终改用 http。

var http = require("http"),
    zlib = require("zlib");

function getGzipped(url, callback) {
    // buffer to store the streamed decompression
    var buffer = [];

    http.get(url, function(res) {
        // pipe the response into the gunzip to decompress
        var gunzip = zlib.createGunzip();            
        res.pipe(gunzip);

        gunzip.on('data', function(data) {
            // decompression chunk ready, add it to the buffer
            buffer.push(data.toString())

        }).on("end", function() {
            // response and decompression complete, join the buffer and return
            callback(null, buffer.join("")); 

        }).on("error", function(e) {
            callback(e);
        })
    }).on('error', function(e) {
        callback(e)
    });
}

getGzipped(url, function(err, data) {
   console.log(data);
});
于 2012-10-08T07:07:32.830 回答
36

尝试添加encoding: null您传递给的选项request,这将避免将下载的正文转换为字符串并将其保存在二进制缓冲区中。

于 2012-10-11T13:20:30.853 回答
30

就像@Iftah 说的那样,设置encoding: null.

完整示例(更少的错误处理):

request = require('request');
zlib = require('zlib');

request(url, {encoding: null}, function(err, response, body){
    if(response.headers['content-encoding'] == 'gzip'){
        zlib.gunzip(body, function(err, dezipped) {
            callback(dezipped.toString());
        });
    } else {
        callback(body);
    }
});
于 2013-09-26T18:20:50.080 回答
29

实际上 request 模块处理 gzip 响应。为了告诉请求模块解码回调函数中的body参数,我们必须在选项中将'gzip'设置为true。让我用一个例子来解释一下。

例子:

var opts = {
  uri: 'some uri which return gzip data',
  gzip: true
}

request(opts, function (err, res, body) {
 // now body and res.body both will contain decoded content.
})

注意:您在“响应”事件中获得的数据不会被解码。

这对我有用。希望它也适用于你们。

我们在使用请求模块时经常遇到的类似问题是 JSON 解析。让我解释一下。如果您希望请求模块自动解析正文并在正文参数中为您提供 JSON 内容。然后你必须在选项中将 'json' 设置为 true。

var opts = {
  uri:'some uri that provides json data', 
  json: true
} 
request(opts, function (err, res, body) {
// body and res.body will contain json content
})

参考:https ://www.npmjs.com/package/request#requestoptions-callback

于 2016-07-26T06:29:49.957 回答
7

https://gist.github.com/miguelmota/9946206所示:

截至 2017 年 12 月,request 和 request-promise 都开箱即用地处理它:

var request = require('request')
  request(
    { method: 'GET'
    , uri: 'http://www.google.com'
    , gzip: true
    }
  , function (error, response, body) {
      // body is the decompressed response body
      console.log('server encoded the data as: ' + (response.headers['content-encoding'] || 'identity'))
      console.log('the decoded data is: ' + body)
    }
  )
于 2018-05-02T16:46:41.813 回答
5

在尝试了不同的 gunzip 方法并解决了与编码有关的错误后,我制定了一个更完整的答案。

希望这对您也有帮助:

var request = require('request');
var zlib = require('zlib');

var options = {
  url: 'http://some.endpoint.com/api/',
  headers: {
    'X-some-headers'  : 'Some headers',
    'Accept-Encoding' : 'gzip, deflate',
  },
  encoding: null
};

request.get(options, function (error, response, body) {

  if (!error && response.statusCode == 200) {
    // If response is gzip, unzip first
    var encoding = response.headers['content-encoding']
    if (encoding && encoding.indexOf('gzip') >= 0) {
      zlib.gunzip(body, function(err, dezipped) {
        var json_string = dezipped.toString('utf-8');
        var json = JSON.parse(json_string);
        // Process the json..
      });
    } else {
      // Response is not gzipped
    }
  }

});
于 2014-05-28T02:42:44.553 回答
4

这是我的两分钱。我遇到了同样的问题,并找到了一个很酷的库,名为concat-stream

let request = require('request');
const zlib = require('zlib');
const concat = require('concat-stream');

request(url)
  .pipe(zlib.createGunzip())
  .pipe(concat(stringBuffer => {
    console.log(stringBuffer.toString());
  }));
于 2016-04-11T14:29:53.237 回答
3

这是一个对响应进行压缩的工作示例(使用 node 的请求模块)

function gunzipJSON(response){

    var gunzip = zlib.createGunzip();
    var json = "";

    gunzip.on('data', function(data){
        json += data.toString();
    });

    gunzip.on('end', function(){
        parseJSON(json);
    });

    response.pipe(gunzip);
}

完整代码:https ://gist.github.com/0xPr0xy/5002984

于 2013-02-21T07:58:22.633 回答
2

我正在使用节点获取。我得到了response.body,我真正想要的是await response.text()

于 2021-02-13T22:09:19.873 回答
2

使用替代方法gotrequest您可以简单地执行以下操作:

got(url).then(response => {
    console.log(response.body);
});

需要时会自动处理解压缩。

于 2017-05-06T10:41:03.740 回答