我用 nodejs 的 xray 模块提取了产品名称和产品价格。当我在抓取时,一些像 /n 这样的 htm lexpressions 带有文本。我想替换所有 html 代码并创建具有替换版本的对象。
我有这样的代码:
var Xray = require('x-ray')
var x = Xray()
var urls=['link','link','link']
for(var i = 0; i < urls.length; i++){
x(urls[i], {
title: '#sp-title',
price: '.lastPrice'.replace(/(<([^>]+)>)/ig,"").trim()
})(function(err, obj) {
console.log(obj);
})
}
上面的示例代码从 3 个不同链接的循环中获取数据并保存为对象,输出如下。
{
title: 'King P 1110 Exotic Katı Meyve Sıkacağı',
price: '\n 549,00 TL '
}
{
title: 'Xiaomi Mi Pro 10000 mAh Type-C Taşınabilir Şarj Cihazı',
price: '\n 144,14 TL '
}
{
title: 'Fakir River Çay Makinesi',
price: '\n 505,50 TL '
}
另外,如何检查此页面上是否存在元素?
谢谢。