1

我有以下代码:

var request = require('request');
var cheerio = require('cheerio');
var URL = require('url')
var fs = require('fs')
fs.readFile("urls.txt", 'utf8', function(err, data) {
    if (err) throw err;
    var urls = data.split('\n');
    urls = urls.filter(function(n){return n});
    for(var i in urls) {
        request(urls[i], function(err, resp, body) {
            if (err)
                throw err;
            $ = cheerio.load(body,{lowerCaseTags: true, xmlMode: true});
            $('item').each(function(){
                console.log("----------");
                console.log($(this).find('title').text());
                console.log($(this).find('link').text());
                console.log($(this).find('pubDate').text());
            });
        }).end();
    }
});

从 urls.txt 文件中,我只有以下 url:

http://www.visir.is/section/?Template=rss&mime=xml

当我在该网址上使用 wget 时,我得到一个看起来像 rss 提要的响应,但是当我在正文上方的代码中执行此操作时,它是空的。有人可以向我解释为什么以及如何解决这个问题吗?

4

1 回答 1

2

更新:只需.end()从原始脚本中删除即可。end()在回调时终止脚本。IMO,在 2016 年,我肯定会选择 Request over Needle。


Request是一只奇怪的鸟,为什么它在你的情况下不起作用,它根本没有在响应中提供任何信息。

改为尝试Needle

var needle = require('needle');
var cheerio = require('cheerio');
var URL = require('url')
var fs = require('fs')
fs.readFile("urls.txt", 'utf8', function(err, data) {
    if (err) throw err;
    var urls = data.split('\n');
    urls = urls.filter(function(n){return n});
    for(var i in urls) {
        needle.get(urls[i], function(err, resp, body) {
            if (err)
                throw err;
            $ = cheerio.load(body,{lowerCaseTags: true, xmlMode: true});
            $('item').each(function(){
                console.log("----------");
                console.log($(this).find('title').text());
                console.log($(this).find('link').text());
                console.log($(this).find('pubDate').text());
            });
        });
    }
});
于 2013-12-08T22:13:25.390 回答