5

我有以下代码,它可以正常工作:

<troveUrl>http://trove.nla.gov.au/work/23043869</troveUrl> 

但我想从同一页面获取以下“id”之后的值,但无法获取!

<work id="23043869" url="/work/23043869">

这是我目前拥有的代码

var request = require ('request'),
    cheerio = require ('cheerio');
    request('http://api.trove.nla.gov.au/result?key=6k6oagt6ott4ohno&zone=book&q-year1-date=2000&l-advformat=Thesis&l-australian=y&q-term2=&q-term3=&q-term0=&q-field1=title%3A&q-type2=all&q-field0=&q-term1=&q-type3=all&q-field3=subject%3A&q-type0=all&q-field2=creator%3A&q-type1=all&l-availability=y%2Ff&q=+date%3A[2000+TO+2014]&q-year2-date=2014&n=1', function (error, response, html) {
      if (!error && response.statusCode == 200) {
        var $ = cheerio.load(html);
        $('troveurl').each(function(i, element){
          var id = $(this);
          console.log(id.text());
        });
      }
    });

任何帮助表示赞赏。

4

2 回答 2

21

您应该传入xmlMode: true选项对象,然后您可以将其解析为 XML。

然后,您可以使用 和 获取标签和数据,$('tag').attr('attribute')$('tag').text()像您所做的那样获取标签之间的数据。

var request = require('request'),
    cheerio = require('cheerio');
request('http://api.trove.nla.gov.au/result?key=6k6oagt6ott4ohno&zone=book&q-year1-date=2000&l-advformat=Thesis&l-australian=y&q-term2=&q-term3=&q-term0=&q-field1=title%3A&q-type2=all&q-field0=&q-term1=&q-type3=all&q-field3=subject%3A&q-type0=all&q-field2=creator%3A&q-type1=all&l-availability=y%2Ff&q=+date%3A[2000+TO+2014]&q-year2-date=2014&n=1', function(error, response, html) {
    if (!error && response.statusCode == 200) {
        var $ = cheerio.load(html, {
          xmlMode: true
        });
        console.log($('work').attr('id'))
    }
});
于 2014-07-29T10:08:31.493 回答
-1

真正的问题在于您用于获取“id”之后的值的语法。以下代码不会 console.log 将 id 输出。

var id = $(this);
console.log(id.text());

正确的语法应该$('your element').attr('id')像上面 Ben Fortune 的回答中提到的那样。但是,传入xmlMode: true选项对象不是必需的。xmlMode: false如果您使用正确的语法,则 传递选项也将起作用。

于 2020-03-11T04:10:43.853 回答