2
page.evaluate(function() { return document; }, function(result){    
    console.log(result)                    
    next();
});

结果实际上是一个巨大的物体。我不知道该对象的属性和属性。我只想要页面的 HTML as you would see it in Chrome inspector

从对象的外观来看,HTML 似乎包含 CSS 和 javascript..这很奇怪。用户不应该看到 CSS 和 javascript,因为它们不是网页的 HTML。这些是外部文件。我只想要用户会看到的 HTML。

4

1 回答 1

7

的类型document是 HTML 文档。要将整个 DOM 作为字符串获取,您可以执行document.documentElement.outerHTML.

从外面evaluate,你可以使用page.content。它是一个字符串。

我不知道您所说的“HTML 包括 CSS 和 JavaScript”或“网页的 HTML”是什么意思。您是指脚本修改的页面源和DOM之间的区别吗?以上都给你当前的 DOM,而不是原始页面源。

于 2013-05-23T06:23:13.850 回答