此服务器获取 google 第一个站点的所有链接:
var http = require('http');
var qs = require('querystring');
var request = require("request");
var cheerio = require('cheerio');
http.createServer().listen(1337, "127.0.0.1");
function parsehl(body, callback){
$ = cheerio.load(body);
var result = '';
links = $('a'); //jquery get all hyperlinks ???????
$(links).each(function(i, link){
var hyperlink = '\n'+ $(link).attr('href');
result = result + hyperlink ;
});
callback(result);}
request({uri: 'http://www.google.com/search?q=rio&start=00' }, function (error, response, body) {
console.log('url requested ') ;
if (!error){
parsehl(body, function(result){
console.log(result);
});
}
else
{
console.log(error);
}
});
此服务器通过标签名称a获取链接。我们需要的链接具有类名l (看起来像 nr 1 但有点像 l)。我们如何通过类名获取这里的链接?我们可能只需要一行放置问号。