0

我一直在尝试用cheerio废弃以下网页,以便为我的一个小项目 获取最新的温度和湿度:网站链接

不幸的是,似乎我必须挖掘很多标签,但我找不到路。我试图检查元素以查看其 css 路径,但效果不佳。我尝试过的代码如下(它基于我在检查元素时得到的 css 选择器):

setInterval(function getTempAndHumidity() 
{
    var url = 
    {
        url: "http://www.meteociel.fr/temps-reel/obs_villes.php?code2=7630",
        method: 'GET',
        proxy: webproxy
    };

    request(url, function (error, response, body) 
    {
        if (!error && response.statusCode == 200) 
        {
            $ = cheerio.load(body);           
            console.log($('tr.texte > td:nth-child(2) > table:nth-child(2) > tbody:nth-child(1) > tr:nth-child(2) > td:nth-child(1) > table:nth-child(1) > tbody:nth-child(1) > tr:nth-child(1) > td:nth-child(1) > center:nth-child(18) > table:nth-child(3) > tbody:nth-child(1) > tr:nth-child(2) > td:nth-child(5) > div:nth-child(1)').html());
        }
        else
        {
            console.log("Error when getting the temperature and humidity rate: " + error);
        }
    })
}, 2000);

我只是得到'null',所以它似乎不起作用。

如果有人能帮我解决这个问题,那将是一个巨大的帮助!

提前致谢

4

1 回答 1

0

所以我找到了解决我的问题的方法。但它非常难看。我想找到一种更优雅的方式来做到这一点!

$ = cheerio.load(body);
var content = $('h1').parent().nextAll().nextAll().next().text();
var catch_values = content.match(/.*km\s+(\d+\.\d+).*(\d\d)%.*/);
var temp = catch_values[1];
var humid_rate = catch_values[2];

欢迎任何帮助、建议或意见!

于 2014-07-02T21:59:39.630 回答