0

我正在尝试使用 node.js 抓取网站。使用的模块是 request、cheerio 和 async。有些页面有 iframe,里面有一些文本。我正在尝试抓取该文本。我得到了 iframe 的 src,构造了完整的 url,然后使用请求模块发出请求。返回的 html 一直说“此 Web 浏览器不支持框架”。

我尝试将构建的 url 放在浏览器地址栏中,然后我得到了文本。

我不确定为什么会这样。请帮忙。如何抓取 iframe 中的内容

示例代码:

var $ = cheerio.load(html);
var url = $('iframe').attr('src');
request(url, function(err, res, html){
   console.log(html);
});

打印的 html 显示“此 Web 浏览器不支持框架”,而不是当我将 url 放入浏览器时应该显示的文本。

4

0 回答 0