我正在尝试使用npm request 和cheerio 来拉取网页并解析它们的html。这适用于根据请求加载 html 的情况。但是我遇到了一个问题,即网站首先加载加载屏幕,然后在片刻之后使用新的信息/元素更新页面。
部分代码:
var url = 'website with loading screen prior to content.com';
var request = require('request');
request(url, function (error, response, body) {
if (!error && response.statusCode == 200) {
console.log(body) // Show the HTML for the Google homepage.
}
})
我想要什么 - 任何一个请求都能够等待特定元素出现在页面上,然后阅读正文。或者能够等待固定的秒数,然后读取正文
其他选项 - 使用 npm 请求可能无法实现,这很好。如果是这种情况,请您指出正确的方向。我正在考虑的其他选择是使用 webdriver.io 或 phantomjs。有没有推荐的行动方案?