2

部分页面 HTML 代码

<div name="price" class="detail-price-test">
  <meta itemprop="price" content="3303">
  <meta itemprop="priceCurrency" content="test">
  <span id="price_label">3 303</span><span class="detail-price-test-sign" id="price_label_sign"> eur</span>
  <script>
    if (price_json.price != '0') {
    var price_container = document.getElementById('price_container'),
    price_cheaper_selector = 'detail-price-cheaper';
    document.getElementById('price_label').innerHTML = price_json.price_formatted;
    document.getElementById('price_label_sign').innerHTML = "&thinsp;eur";
    if (parseFloat(price_json.old_price) >
    parseFloat(price_json.price) &&
    price_container &&
    !price_container.hasClass(price_cheaper_selector)
    ) {
    price_container.addClass(price_cheaper_selector);
    }
    }
  </script>
  <link itemprop="availability" href="http://schema.org/InStock">
</div>

1)第一个问题:如何从 meta itemprop="price" 中提取值为 3303 的 attr 内容?或者用渗透,这是不可能的?

2)第二个问题:为什么我不能在这个中获得价值 3 303<span id="price_label">3 303</span>

osmosis
.get('myURL.com')
.find('div.detail-price-test span#price_label') //or div.detail-price-test span[id=price_label]
.set('test')
.data(console.log);

结果在 cosole: test: ''

也许JavaScript脚本和渗透中的问题不能解决这个问题?

4

2 回答 2

0

在 Cheerio 它是:

$('[itemprop="price"]').attr('content')

在渗透?不知道,我从来没有听说过。

于 2018-12-10T09:41:24.687 回答
0

您的选择器不正确。

第一个问题的答案:选择器应该是:'meta[itemprop="price"]@content' 你可以这样做:

osmosis
.get('myURL.com')
.find('meta[itemprop="price"]@content')
.set('price')
.data(console.log) // {price : 3303}

第二个问题的答案:正确的选择器是

  1. 'div.detail-price-test > span#price_label'
  2. 'span#price_label'
  3. '#price_label'

做类似的事情:

osmosis
.get('myURL.com')
.find('div.detail-price-test > span#price_label')
.set('test')
.data(console.log); // {test : 3...}
于 2018-12-14T17:05:25.820 回答