0

此服务器获取 google 第一个站点的所有链接:

var     http = require('http');
var qs = require('querystring');
var request = require("request");
var cheerio = require('cheerio');

http.createServer().listen(1337, "127.0.0.1");

function parsehl(body, callback){
    $ = cheerio.load(body);
    var result = '';

    links = $('a'); //jquery get all hyperlinks       ???????

    $(links).each(function(i, link){
        var hyperlink = '\n'+ $(link).attr('href');
        result = result + hyperlink  ;
    });

    callback(result);}

    request({uri: 'http://www.google.com/search?q=rio&start=00'  }, function (error, response, body) {
        console.log('url requested ') ;
        if (!error){
            parsehl(body,  function(result){
                console.log(result);
            });
        }
        else
        {   
            console.log(error);
        }
    }); 

此服务器通过标签名称a获取链接。我们需要的链接具有类名l (看起来像 nr 1 但有点像 l)。我们如何通过类名获取这里的链接?我们可能只需要一行放置问号。

4

1 回答 1

0

你有没有尝试过:

links = $('a.l');

?

于 2013-03-26T13:06:15.970 回答