1

我正在尝试在我的网页上运行一个简单的抓取,但我遇到的问题是我似乎无法正确选择带有我的抓取器的 HTML 元素。我以为我从我的 中正确获取了属性<li>,但是我得到了undefined每个对象属性的值。

我正在寻找data-name,data-addressdata-url值。

scrape.js

var request = require('request');
var cheerio = require('cheerio');

request('http://personalSite.com', function (error, response, html) {
  if (!error && response.statusCode == 200) {
    var $ = cheerio.load(html);

    $('li').each(function(i, element){

        var li = $(this).contents();


        var name = li.attr('name');
        var address = li.attr('address');
        var url = li.attr('url');


        var metadata = {
            name : name,
            address : address,
            url : url
        };
        console.log(metadata);
    });
  }
});

html:

<li id="v1065" data-name="Jerry's Food" data-address="5120 West 43rd Street"  data-url="http://www.testsite1.com/" data-category="1"><a href="#" class="list-digital">
                                    <span class="venue-name">Jerry's Food</span><br />
                                    <span class="venue-address">5120 West 43rd Street</span>

                                    </a>
                                </li>                           
                                <li id="v249" data-name="Accel Partners" data-address="13482 Seventh Avenue" data-url="http://www.testsite2.com" data-category="3"><a href="#" class="list-digital">
                                    <span class="venue-name">Mike's Pizza</span><br />
                                    <span class="venue-address">13482 Seventh Avenue</span>                             
                                    </a>
                                </li>                           
4

1 回答 1

0

使用.attr()方法,您应该使用完整的属性名称

var name = li.attr('data-name');
var address = li.attr('data-address');
var url = li.attr('data-url');

或者你可以使用

var name = li.data('name');
var address = li.data('address');
var url = li.data('url');
于 2014-09-19T17:10:23.397 回答