0

我正在编写一个爬虫来获取 psp iso 文件以根据评级下载。我很难针对每个评级。我怎样才能抓住这个元素?我已经包含了一个快照供参考。评级元素位于tr td标签内。

var request = require('request'),
  cheerio = require('cheerio'),
  fs = require('fs');

var url = 'http://goo.gl/cc4HRc',
  pspGames = [];

request(url, function (error, response, html) {
  if (!error && response.statusCode === 200) {
    var $ = cheerio.load(html);
    $('.gamelist', 'td').each(function () {
      var links = $(this).attr('href');
      pspGames.push(links);
    });
   }
});

在此处输入图像描述

4

2 回答 2

1

我不确定您将如何存储评级,但也许这样的事情会有所帮助:

$('.gamelist').each(function () {
    var link = $(this.attr('href'));
    var rating = $(this).parent().siblings().first().text();
    pspGames.push({"link": link, "rating": rating});
});
于 2014-06-20T01:12:36.520 回答
1

查看链接,它看起来像这样:

<tr>
  <td>
    <a class="index gamelist" title="Corpse Party - Book of Shadows (Japan) ISO Info and Download" href="/Sony_Playstation_Portable_ISOs/Corpse_Party_-_Book_of_Shadows_(Japan)/158702">Corpse Party - Book of Shadows (Japan)</a>
  </td>
  <td align="center">4.9504</td>
</tr>

你应该这样做:$('.gamelist').each(

于 2014-06-20T01:03:27.110 回答